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Die BASF Aktiengesellschaf t in Ludwigshaf en/Deutschland hat 
eine Patentanmeldung unter der Bezeichnung 

"Verfahren zur Herstellung von Biotin" 

am 19. Februar 1998 beim Deutschen Patentamt eingereicht. 

Die angehefteten Stiicke sind eine richtige und genaue 
Wiedergabe der urspriinglichen Unterlagen dieser Patent- 
anmeldung. 

Die Anmeldung hat im Deutschen Patentamt vorlaufig die Sym- 
bole C 12 C 07 H und C 12 P der Internationalen Patent - 
klassif ikation erhalten. 
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Verfahren zur Herstellxmg von Biotin, dadurch gekennzeichnet , 
daB man ein S-Adenosyl-Methionin-Synthasegen mit der Sequenz 
SEQ ID No. 1 und mindestens ein weiteres Biotin-Biosynthese- 
gen bioSl, bioS2 oder bioS3 mit den Sequenzen SEQ ID No. 3, 
SEQ ID No. 5 Oder SEQ ID No. 7 sowie ihre funktionellen Va- 
rianten, Analoge oder Derivate in einem prokaryontischen oder 
eukaryontischen Wirtsorganismus , der in der Lage ist Biotin 
zu synthetisieren, exprimiert, diesen zuchtet und das synthe- 
tisierte Biotin direkt, nach Abtrennung der Biomasse oder 
nach Reinigung des Bio tins venvendet. 



/ 



Verfahren nach Anspruch 1, dadurch gekennzeichnet , daB es 
sich bei den Varianten der Gene mit den Sequenzen SEQ ID 
No.l, SEQ ID No. 3, SEQ ID No . 5 und SEQ ID No. 7 urn Gene 
handelt, die auf der von den Sequenzen nach Anspruch 1 abge- 
leiteten Aminosaureebene eine Homologie von 30 bis 100 % auf- 
weisen und eine gesteigerte Biotinsynthese ermoglichen. 



3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet , daS 
als Wirtsorganismus ein Organismus ausgewahlt aus der Gruppe 
der Gattungen Escherichia, Citrobacter, Serratia, Klebsiella, 

25 Salmonella, Pseudomonas, Comamonas, Acinetobacter , Azotobac- 

ter, Chromobacterium, Bacillus, Chlostridium, Arthrobacter , 
Corynebacter ium, Brevibacterium, Lactococcus , Lactobacillus , 
Streptomyces, Rhizobium, Agrobacterium, Staphylococcus, Rho- 
dotorula, Sprorobolomyces, Yarrowia, Schizosaccharomyces oder 

3 0 Saccharomyces verwendet wird. 

4. Verfahren nach den Anspruchen 1 bis 3, dadurch gekennzeich- 
net, daB als wirtsorganismus eine regulat ionsdef ekte Biotin- 
mutante verwendet wird. 



5. 



Verfahren nach den Anspruchen 1 bis 4, dadurch gekennzeich- 
net, daB die Expression mindestens einer Kopie der Gene mit 
den Sequenzen SEQ ID No.l, SEQ ID No. 3, SEQ ID No. 5 und SEQ 
ID No. 7 nach Anspruch 1 allein oder mit einer oder mehreren 
Kopien mindestens eines weiteren Biotingens ausgewahlt aus 
der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, 
bioX, bioY Oder bioR in einem prokaryontischen oder eukaryon- 
tischen Wirtsorganismus erfolgt. 
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Verfahren nach den Anspruchen 1 bis 5, dadurch gekeimzeich- 
net, daB die Expression mindestens einer Kopie der Gene mit 
den Sequenzen SEQ ID No.l, SEQ ID No, 3, SEQ ID No. 5 und SEQ 
ID No. 7 nach Anspruch 1 allein oder mit einer Oder mehreren 
Kopien mindestens eines weiteren Biotingens ausgewahlt aus 
der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, 
bioX, bioY Oder bioR in einem prokaryontischen oder eukaryon- 
tischen Wirtsorganismus auf einem gemeinsamen oder auf ge- 
trennten Vektoren erfolgt. 

Genkonstrukt enthaltend ein S-Adenosyl-Methionin-Synthasegen 
mit der SEQ ID No. 1 und mindestens ein wei teres Biotin-Bio- 
synthesegen bioSl, bioS2 oder bioS3 mit den Sequenzen SEQ ID 
No. 3, SEQ ID No.. 5 und SEQ ID No. 7 sowie ihre funktionellen 
Varianten, Analoge oder Derivate, das mit einem oder mehreren 
Regulationssignalen zur Erhohung der Genexpression und/oder 
Proteinexpression funktionell verknupft ist und/oder dessen 
naturliche Regulation ausgeschaltet wurde. 



20 8. Genkonstrukt nach Anspruch 1, dadurch gekennzeichnet , daB es 
in einem Vektor inseriert wurde, der fur die Expression des 
Gens in einem prokaryontischen oder eukaryontischen wirtsor- 
ganismus geeignet ist. 



25 9. Genkonstukt nach Anspruch 7 oder 8, dadurch gekennzeichnet , 
daB die Gene mit den Sequenzen SEQ ID No. 1, SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No . 7 sowie ihre funktionellen Va- 
rianten, Analoge oder Derivate in mehreren Kopien im Genkon- 
strukt vorliegen. 

30 

10. Genkonstrukt nach Anspruchen 7 bis 9, dadurch gekennzeichnet , 
daB das S-Adenosyl-Methionin-Synthasegen SEQ ID No. 1 und 
mindestens ein weiteres Biotin-Biosynthesegen bioSl, bioS2 
Oder bioS3 mit den Sequenzen SEQ ID No. 3, SEQ ID No. 5 und 
35 SEQ ID No. 7 sowie ihre funktionellen Varianten, Analoge oder 

Derivate nach Anspruch 7 zusammen mit einer oder mehreren Ko- 
pien mindestens eines weiteren Gens ausgewahlt aus der Gruppe 
bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
Oder bioR im Genkonstrukt oder Vektor vorliegt. 



40 



-1-1-. — Organismen--entha-l-tend-ein-Genkonstr.ukt_gemaB_,den_Ai^ 
bis 10. 



12. Verwendung der Sequenzen gemaB Anspruch 1 zur Herstellung von 
45 Biotin. 
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13. Verwendung des bioS3-Gens mit der Seguenz SEQ ID No. 7 seiner 
funktionellen Varianten, Analoge oder Derivate allein oder in 
Kombination mit mindestens einem weiteren Gen ausgewahlt axis 
der Gruppe S-Adenosyl-Methionin-Synthasegen, bioSl, bioS2, 
bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
Oder bioR zur Herstellung von Bio tin. 

14. Verwendung eines Genkonstrukts gemaB den Anspruchen 7 bis 10 
zur Herstellung von Bio tin. 
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verfahren zur Herstellung von Biotin 
Beschreibung 

5 

Die Erfindung betrifft ein Genkonstrukt , enthaltend ein S-Adeno- 
syl-Methionin-Synthasegen, mit der Sequenz SEQ ID No. 1 und ein 
Biotin-Biosynthesegen bioSl, bioS2 xznd/oder bioS3 mit den Secjuen- 
zen SEQ ID No. 3, SEQ ID No . 5 bzw. SEQ ID No. 7 und gegebenenf alls 
mindestens einer weiteren Biotinsynthesegensequenz ausgewahlt aus 
der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY Oder bioR. Die Erfindung betrifft weiterhin Organismen, die 
dieses Genkonstrukt enthalten und die Verwendung des Genkon- 
strukts zur Herstellung von Biotin, sowie ein Verfahren zur Her- 
^5 stellung von Biotin. 

Als Coenzym spielt Biotin (Vitamin H) eine essentielle Rolle bei 
enzymkatalysierten Carboxylierungs- und Decarboxylierungsreaktio- 
nen. Biotin ist damit ein essentieller Faktor in lebenden Zellen. 
Biotin muB von fast alien Tieren und einigen Mikroorganismen von 
auBen aufgenommen werden, da sie Biotin nicht selber synthetisie- 
ren konnen. Es ist damit fur diese Organismen ein essentielles 
Vitamin. Bakterien, Hefen und Planzen hingegen konnen Biotin aus 
Vorstufen selbst synthetisieren (Brown et al. Biotechnol. Genet. 
^5 Eng. Rev. 9, 1991: 295 - 326, DeMoll, E., Escherichia coli and 
Salmonella, eds. Neidhardt, F. C. et al. ASM Press, Washington 
DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5). 

Die Biotinsynthese wurde in bakteriellen Organismen speziell im 
gramnegativen Bakterium Escherichia coli und im grampositiven 
Bakterium Bacillus sphaericus untersucht (Brown et al. Biotech- 
nol. Genet. Eng. Rev. 9, 1991: 295 - 326). Als erstes bisher be- 
kanntes Intermediat in E. coli wird Pimelyl-CoA (PmCoA) angese- 
hen, das aus der Fettsauresynthese stammt (DeMoll, E., Escheri- 
35 chia coli and Salmonella, eds. Neidhardt, F. C. et al. ASM Press, 
Washington DC, USA, 1996: 704 - 708, ISBN 1-55581-084-5 1996). 
Der Syntheseweg dieser Biotin-Vorstuf e in E. coli ist bisher 
weitgehend unbekannt (Lemoine et al., Mol. Microbiol. 19, 1996: 
645 - 647) . Es wurden mit bioC und bioH zwei Gene identif iziert, 
40 deren korrespondierende Proteine fur die Synthese von Pm-CoA ver- 

antwortlich sind..._Die_enzyTnatLi^ii^_ Genprodukte BioH 

und BioC ist bisher nicht bekannt (Lemoine et al., Mol. Micro- 
biol. 19, 1996: 645 - 647, DeMoll, E., Escherichia coli and Sal- 
monella, eds. Neidhardt, F. C. et al. ASM Press, Washington DC, 
45 USA, 1996: 704 - 708, ISBN 1-55581-084-5). Pm-CoA wird in vier 
weiteren enzymatischen Schritten zum Biotin umgewandelt. Ausge- 
hend vom Pm-CoA findet zuerst die Kondensation mit Alanin zu 
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7-Keto-8-Amino-Pelargonsaure (KAPA) durch BioF statt. Es folgt 
die Umsetzung von KAPA zu 7,8 Diamino-Pelargonsaure (DAPA) durch 
BioA, Der nachste Schritt fuhrt nach einer ATP-abhangigen Carbo- 
xylierungsreaktion zum Dethiobiotin (DTB) und wird durch BioD ka- 
5 talysiert. Im letzten Schritt findet die Umsetzung von DTB zu 
Biotin statt. Dieser Schritt wird durch BioB katalysiert. Der 
chemische und enzymatische Mechanismus der Umwandlung von DTB zu 
Biotin ist bisher nur imvollstandig verstanden und aufgeklart. 





10 Eine Charakterisierung der Umwandl\ing von DTB zu Biotin wurde 
bisher ausschlieSlich in bakteriellen bzw. pf lanzlicheri Zellex- 
trakten durchgefuhrt (WO94/8023, EP-B-0 449 724, Sanyal et al. 
Arch. Biochem. Biophys., Vol, 326, No. 1, 1996: 48 - 56 und Bio- 
chemistry 33, 1994: 3625 - 3631, Baldet et al . Europ . J- Biochem. 
15 217, 1, 1993: 479 - 485, Me j ean et al . Biochem. Biophys, Res. 

Commun., Vol. 217, No. 3, 1995: 1231 - 1237, Ohshiro et al., Bio- 
sci. Biotechnol. Biochem., 58, 9, 1994: 1738 - 1741). 

In vitro Studien haben gezeigt, daB niedermolekulare Faktoren wie 
20 NADPH, Cystein, Thiamin, Fe2+, Asparagin, Serin, Fruktose 

1-6-bisphosphat und S-Adenosylmethionin die Synthese von Biotin 
stimulieren konnen (Ohshiro et al . , Biosci. Biotechnol. Biochem., 

58, 9, 1994: 1738 - 1741, Birch et al., J. Biol. Chem. 270, 32, 
1995: 19158 - 19165, Ifuku et al . , Biosci. Biotechnol. Biochem., 

59, 2, 1995: 185 - 189, Sanyal et al. Arch. Biochem. Biophys. 
326, 1, 1996: 48 - 56) . 

Neben diesen niedermolekularen Faktoren wurden weitere Proteine 
identif iziert , die die Synthese von Biotin aus DTB in Gegenwart 
von BioB stimulieren. Dabei handelt es sich um Flavodoxin und 
Flavodoxin-NADPH-Reduktase {Birch et al., J. Biol. Chem. 270, 32, 
1995: 19158 - 19165, Ifuk et al., Biosci. Biotechnol. Biochem., 
59, 2, 1995: 185 - 189, Sanyal et al.. Arch. Biochem. Biophys. 
326, 1, 1996: 48 - 56). Weitere Proteine, die eine Stimulation 
der Biotinsynthese bewirken, sind die in der deutschen Anmeldung 
mit der Anmeldenummer 197.31274.8 (Prioritat 22.7.97) beschriebe- 
nen Gene bioSl und bioS2. 



25 



30 



35 



40 



Uber die Herkxinft des Schwefels im Biotinmolekul existieren \jin- 
terschiedliche Ergebnisse. Bei Untersuchungen der Biotinsynthese 
in Gesamtzellextrakten wurde gezeigt, dafl in Gegenwart von ^^s- 
markiertem Cystein Radioaktivi tat in Biotin inkorporiert wurde; 
weder mit ^^S-markiertem Methionin noch mit S-Adenosyl-Methionin 
konnte ein Schwef el-Einbau ins Biotinmolekul nachgewiesen werden 
(Ifuku et al . , Biosci. Biotechnol. Biochem. 59, 2, 1995: 184 - 
45 189, Birch et al., J. Biol. Chem. 270, 32, 1995: 19158 - 19165). 



Die fur die beschriebenen Proteine kodierenden Gene bioF, bioA, 
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bioD, und bioB sind in E. coli auf einem bidirektionalem Operon 
kodiert. Dieses Operon liegt zwischen der X-attachement-si te und 
dem uvrB Gen Locus bei ca. 17 Minuten auf dem E. coli Chromosom 
(Berlyn et al. 1996: 1715 - 1902). Auf diesem Operon sind zusatz- 
5 lich noch zwei weitere Gene kodiert, von denen das eine, bioC, 
bereits beschriebene Funktionen in der Syn these von Pm-CoA hat, 
wahrend einem offenen Leseraster hinter bioA bisher keine Funk- 
tion zugeordnet werden konnte (WO94/8023, Otsuka et al., J. Biol. 
Chem. 263, 1988: 19577 - 85). Hoch konservierte Homologe zu den 
IQ E. coli Proteinen BioF, A, D, B wurden in B. sphaericus, B. sub- 
tilis, Syneccocystis sp. (Brovm et al. Biotechnol . Genet. Eng. 
Rev. 9, 1991: 295 - 326, Bower et al . , J. Bacterid. 175, 1996: 
4122 - 4130, Kaneko et al., DNA Res. 3, 3, 1996: 109 - 136), Ar- 
chaebakterien wie Methanococcus janaschi, Hefen wie Saccharomyces 
^5 cerevisiae (Zhang et al.. Arch. Biochem. Biophys. 309, 1, 1994: 
29 - 35) Oder in Pflanzen wie Arabidopsis thaliana (Baldet et 
al., C. R. Acad. Sci, III, Sci. Vie. 319, 2, 1996: 99 - 106)) ge- 
funden. 

20 Die Synthese von Pm-CoA scheint in den beiden bisher untersuchten 
gram-positiven Mikroorganismen anders zu verlaufen als in E. 
coli. Es konnten keine Homologen von bioH und bioC gefunden wer- 
den (Brown et al. Biotechnol. Genet. Eng. Rev. 9, 1991: 295 - 
326) . 



25 



Biotin ist eine optisch aktive Siibstanz mit drei Chiralitatszen- 
tren. Es wird bisher wirtschaf tlich nur uber eine vielstufige, 
teure chemische Synthese hergestellt werden. 



30 Alternativ zu dieser chemischen Synthese wurde eine Vielzahl von 
^^^^ Versuchen untemommen, ein f ermentatives Verfahren zur Herstel- 
^^^^B lung von Biotin mit Mikroorganismen aufzubauen. Durch Klonierung 
^^^^^ des Biotin-Operons auf mul ti-copy-Plasmide konnte die Biotinsynt- 
~ ~ hese in den mit diesen Genen transformierten. Mikroorganismen er- 
35 hoht werden. Eine weitere Erh6hung der Biotinsynthese wurde durch 
die Deregulierung der Biotingenexpression uber die Selektion von 
birA-Mutanten erreicht (Pai C. H,, J. Bacterid. 112, 1972: 1280 
- 1287) . Die Kombination beider Ansatze, das heiBt die Expression 
der Plasmid-kodierten Biosynthesegene in einem regulationsdef i - 
40 zienten Stamm (EP-B-0 236 429), brachte eine weitere Steigerung 

der Produktivitat. Das Biotin-Operon kann dabei entweder unter 

ltonrt^rie~s"eines^ 

(£P_B-0 236 429) , Oder seine Gene konnen unter die Kontrolle ei- 
nes extern regulierbaren Promoters gebracht werden (WO94/08023) . 

45 

Durch die bisher verfolgten Ansatze zur f ermentativen Herstellung 
von Biotin in E. coli konnte keine wirtschaf tlich ausreichende 
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Produktivitat erreicht werden. 

Aufgabe der vorliegenden Erfindung war es, ein technisches, fer- 
mentatives Verfahren zur Herstell\ing von Biotin zu entwickeln, 
5 dafi sine moglichst hohe Biotinsyn these zeigt. 

Diese Aufgabe wurde durch das erf indungsgemaBe Verfahren zur Her- 
stellung von Biotin, dadurch gekennzeichnet , daB man ein S-Adeno- 
syl-Methionin-Synthase (SAM-Synthase) -Gen mit der Sequenz SEQ ID 
10 No, 1 und mindestens ein weiteres Biotin Biosynthesegen bioSl, 

bioS2 Oder bioS3 mit den Sequenzen SEQ ID No. 3, SEQ ID No. 5 und 
SEQ ID No -7 sowie ihre funktionellen Varianten, Analoge Oder De- 
rivate in einem prokaryontischen oder eukaryontischen wirtsorga- 
nismus, der in der Lage ist Biotin zu synthetisieren, exprimiert, 
_ 15 diesen zuchtet und das synthetisierte Biotin direkt, nach Abtren- 
^^^^k nung der Biomasse oder nach Reinigung des Biotins verwendet, ge- 

Die im erf indiingsgemaSen Verfahren verwendeten Gene, das SAM-Syn- 
20 thase-Gen mit der Sequenz SEQ ID No. 1 und die Biotin-Biosynthe- 
segene bioSl, bioS2 und bioSB mit den Sequenzen SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No . 7 werden in der SwissProt-Datenbank 
unter den "Accession" -Nummern P04384 (metK) , U29581 (bioSl) , 
P39171 (bioS2) und D90811 (bioS3) gefuhrt. In der Datenbank sind 
25 eine Reihe von Homologen zu MetK aus E. coli beschrieben. Diese 
Homologe umfassen Organismen wie weitere Eubakterien (z.B. H. in- 
fluenza, B. subtilis) , wie auch Eukaryonten (z.B. Hefen: S. cere- 
visiae, Planta: P. deltoides, Arthropoda D. melanogaster , und 
Mammalia: R. norvegicus) . 

30 

^^^^ Durch Expression einer oder mehrerer des SAM-Synthase-Gens mit 
^^^^^^ der Sequenz SEQ ID No. 1, seiner funktionellen Varianten, Analoge 
^P^^^V Oder Derivate in Kombination mit mindestens einem der Biotinsy- 

thesegene bioSl, bioS2 oder bioS3 mit den Sequenzen SEQ ID No. 3, 
2 5 SEQ ID No. 5 und SEQ ID No , 7 sowie deren funktionelle Varianten, 
Analoge oder Derivate in einem prokaryontischen oder eukaryonti- 
schen Wirtsorganismus laBt sich die Produktivitat der Biotinbio- 
synthese deutlich steigern. Bevorzugt wird wird eine Kombination 
von SAM-Synthase-Gen und biosl zur Expression verwendet. Vorteil- 
hafterweise wird fur eine gesteigerte Biotinsynthese gleichzeitig 

40 

mindestens ein weiteres Biotingen ausgewahlt aus der Gruppe bioA, 
bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY oder bioR 
mit exprimiert. Durch die Expression der Gene wird die Synthese 
von Biotin um mindestens den Faktor 2 gegenuber der Kontrolle 
ohne diese Gene, bevorzugt um einen Faktor grofler 3, gesteigert. 
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Nach Isolierxing und Sequenzierung sind die im erf indungsgemaBen 
Verfahren verwendeten Gene, das SAM-Synthase-Gen mit der Nukleo- 
tidsequenz SEQ ID No. 1/ das bioSl Gen mit der Nukleotidsequenz 
SEQ ID No. 3, das bioS2 Gen mit der Nukleotidsequenz SEQ ID No. 5 
5 und das bioS3 Gen mit der Nukleotidsec[uenz SEQ ID No. 7 erhalt- 
lich, die fur die in SEQ ID NO: 2, respektive SEQ ID No. 4, re- 
spektive SEQ ID No. 6 und SEQ ID No. 8 angegebenen Aminosaurese - 
quenzen Oder deren Allelvariationen kodieren. Unter Varianten 
sind SEQ ID NO. 1-, SEQ ID No. 3- bzw. SEQ ID No. 5, respektive SEQ 
10 ID No. 7 -Variant en zu verstehen, die 30 bis 100 % Homologie auf 
Aminosaureebene, bevorzugt 50 bis 100 %, ganz besonders bevorzugt 
80 bis 100 % aufweisen. Allelvarianten umfassen insbesondere 
funktionelle Varianten, die durch Deletion, Insertion Oder Sub- 
stitution von Nukleotiden aus den in SEQ ID NO: 1, SEQ ID No. 3, 
15 SEQ ID No. 5 und SEQ ID No . 7 darges tell ten Sequenzen erhaltlich 
sind, wobei die enzymatische Aktivitat aber erhalten bleibt. 

Weiterhin sind unter Varianten auch funktionelle Aquivalente der 
Gene wie die 0-Acetyl-serinsulf ohydrolase A, die 0-Acetyl-serin- 
sulf ohydrolase B, die p-Cystathionase (siehe Flint et al., J- 
Biol. Chem., Vol. 271, 1996: 16053 - 16067) Oder nifS und seine 
prokaryontischen und eukaryontischen Homologen beispielsweise aus 
Klebsiella, Candida, Hefen Oder aus Caenorhabdi tis zu verstehen, 
die in der Lage sind die enzymatische Aktivitat von bioSl, bioS2 
Oder bioS3 in der Biotinsynthese zu ubemehmen. 

Unter f unktionellen Analogen von SEQ ID NO: 1, SEQ ID NO: 3, 
SEQ ID NO: 5 und SEQ ID No. 7 sind beispielsweise ihre prokaryon- 
tischen Oder eukaryontischen Homologen wie bakterielle, pilzli- 
che, pflanzliche, tierische Oder menschliche Homologen zu verste- 
hen. Unter Analogen sind weiterhin auch verkurzte Sequenzen, Ein- 
zelstrang-DNA oder RNA der codierenden und nichtcodierenden DNA- 
Sequenz zu verstehen. 

35 

Derivate sind beispielsweise Promotorvarianten zu verstehen. Die 
Promotoren, die den angegebenen Nukleotidsequenz en vorgeschalten 
sind, konnen durch ein oder mehrere Nukleotidaustausche, durch 
Insertion (en) und/oder Deletion (en) verandert sein, ohne daB aber 
4Q die Punktionalitat bzw. Wirksamkeit der Promotoren beeintrachtigt 

w ird. Des wei ter e n kon nen die Promotoren durch Veranderung ihrer 

Sequenz in ihrer Wirksamkeit erh6ht oder kompTlett "diTr^chT^wirksa" 
mere Promotoren auch artfremder Organismen ausgetauscht werden. 

45 Unter Derivaten sind auch Varianten zu verstehen, deren Nukleo- 
tidsequenz im Bereich von -1 bis -3 0 vor dem Startkodon so veran- 
dert wurden, dafi die Genexpression und/oder die Proteinexpression 
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erhoht wird. Vorteilhaf terweise geschieht dies durch eine veran- 
derte Shine-Dalgarno-Sequenz . 

Als prokaryontische Wirtsorganismen des erf indxingsgemaBen Verfah- 
^ rens kommen prinzipiell alle Biotin synthetisierenden gram-nega- 
tiven Oder gram-positiven Bakterien in Frage. Als gram-negative 
Bakterien seien beispielhaft Enterobacteriaceae wie die Gattungen 
Escherichia, Aerobacter, Enterobacter , Citrobacter, Shigella, 
Klebsiella, Serratia, Erwinia Oder Salmonella, Pseudomonadaceae 
10 wie die Gattungen Pseudomonas, Xanthomonas, Burkholderia , Gluco- 
nobacter, Nitrosomonas, Nitrobacter, Methanomonas , Comamonas, 
Cellulomonas Oder Acetobacter, Azotobacteraceae wie die Gattungen 
Azotobacter, Azomonas, Beijerinckia oder Derxia, Neisseriaceae 
wie die Gattungen Moraxella, Acinetobacter , Kingella, Neisseria 
15 Oder Branhamella, die Rhizobiaceae wie die Gattungen Rhizobium 
Oder Agrobacteriiim Oder die gram-negativen Gattungen Zymomonas, 
Chromobacterium oder Flavobacterium, genannt. Als gram-positive 
Bakterien seien beispielhaft die Endosporen-bildenden gram-posi- 
tiven aeroben oder anaeroben Bakterien wie die Gattungen Bacil- 
20 lus, Sporolactobacillus oder Clostridium, die coryneformen Bakte- 
rien wie die Gattungen Arthrobacter , Cellulomonas, Curtobacte- 
rium, Corynebacterium, Brevibacterium, Microbacterium oder Kurt- 
hia, die Actinomycetales wie die Gattungen Mycobacterium, Rhodo- 
coccus, Streptomyces oder Nocardia, die Lactobacillaceae wie die 
25 Gattungen Lactobacillus oder Lactococcus, die gram-positiven Kok- 
ken wie die Gattungen Micrococcus oder Staphylococcus, genannt. 

Bevorzugt werden Bakterien der Gattungen Escherichia, Citrobac- 
ter, Serratia, Klebsiella, Salmonella, Pseudomonas, Comamonas, 
30 Acinetobacter, Azotobacter, Chromobacterium, Bacillus, Clostri- 
dium, Arthrobacter, Corynebacterium, Brevibacterium, Lactococcus, 
Lactobacillus, Streptomyces, Rhizobium, Agrobacterium oder Sta- 
phylococcus im erf indungsgemaBen Verfahren verwendet. Besonders 
bevorzugt werden Gatt\ingen und Arten wie Escherichia coli, Citro- 
35 bacter freundii, Serratia marcescens. Salmonella typhimurium, 

Pseudomonas mendocina, Pseudomonas aeruginosa, Pseudomonas muta- 
bilis, Pseudomonas chlororaphis, Pseudomonas fluorescens, Comamo- 
nas acidovorans, Comamonas testosteroni , Acinetobacter calcoace- 
ticus, Azotobacter vinelandii, Chromobacterium violaceum, Bacil- 
lus subtilis. Bacillus sphaericus. Bacillus stearothermophilus , 
Bacillus pumilus. Bacillus lichenif ormis. Bacillus amyloliquef a- 
ciens. Bacillus megaterium. Bacillus cereus. Bacillus thuringien- 
sis, Arthrobacter citreus, Arthrobacter paraffineus, Corynebacte- 
rium glutamicvim, Corynebacterium primorioxydans, Corynebacterium 
sp., Brevibacterium ketoglutamicum, Brevibacterium linens, Brevi- 

45 

bacterium sp., Streptomyces lividans, Rhizobium leguminosarum 
Oder Agrobacterium tumefaciens. Vorteilhaf terweise werden Bakte- 
rien verwendet, die schon eine erhohte naturliche Biotinproduk- 
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tion besitzen. 

Die taxonomische Stellung der aufgefuhrten Gattungen unterlag in 
den letzten Jahren einem starken Wandel und bef indet sich noch 
5 immer im FluB, da falsche Gattungs- und Artnamen korrigiert wer- 
den. Aufgrund dieser in der Vergangenheit haufig erf orderlichen 
taxonomischen Umgruppierungen der genannten Gattungen innerhalb 
der bakteriellen Systematik sind auch andere als die oben genann- 
ten Familien, Gattungen und Arten fur das erf indungsgemafie Ver- 
10 fahren geeignet, 

Als eukaryontische Wirtsorganismen des erf indungsgemafien Verfah- 
rens kommen prinzipiell alle Biotin synthetisierenden Organismen 
in Frage wie Pilze, Hefen, Pflanzen Oder pflanzliche Zellen. Als 
^^^15 Hefen seien die Gattungen Rhodotorula, Yarrowia, Sporobolomyces, 
^^^^^ Saccharomyces oder Schizosaccharomyces bevorzugt genannt. Beson- 
fl^^V ders bevorzugt sind die Gattungen \md Arten Rhodotorula rubra, 
^^^^^ Rhodotorula glutinis, Rhodotorula graminis, Yarrowia lipolytica, 
Sporobolomyces salmonicolor , Sporobolomyces shibatanus oder Sac- 
20 charomyces cerevisiae. 

Als Wirtsorganismus konnen prinzipiell alle Pflanzen verwendet 
werden, bevorzugt werden Pflanzen, die in der Tierernahrung oder 
in der huraanen Emahrung eine Rolle spielen wie Mais, Weizen, 
25 Gerste, Roggen, Kartoffeln, Erbsen, Bohnen, Sonnenblumen, Palmen, 
Hirse, Sesam, Kopra oder Raps. Auch Pflanzen wie Arabidopsis tha- 
liana oder Lavendula vera sind geeignet- Besonders bevorzugt wer- 
den pflanzliche Zellkulturen, Protoplasten aus Pflanzen oder Ka- 
luskulturen. 

30 

^^^^ Vorteilhaf terweise werden im erf indungsgemaBen verfahren Mikroor- 
^^^^B ganismen wie Bakterien, Pilze, Hefen oder pflanzliche Zellen ver- 

^^^1^ wendet, die in der Lage sind Biotin in das Anzuchtsmedium auszu- 
scheiden und die gegebenenf alls zusatzlich schon eine erhohte na- 

35 turliche Biotinsynthese haben. Vorteilhaf terweise konnen diese 
Organismen noch bezuglich der Regulation ihrer Biotinbiosynthese 
defekt sein, das heiBt es f indet keine oder nur eine sehr verrin- 
gerte Regulation der Synthese statt. Dieser Regulationsdef ekt hat 
zur Folge, dafl diese Organismen schon eine wesentlich hohere Bio- 

40 tinproduktivitat besitzen. Ein solcher Regulationsdef ekt ist bei- 

spielsweise~von^Escher.ichia_colA_aAs bi rA-Def e ktmutariten^ bekannt 

und sollte vorzugsweise in Form eines durch auBere Einflusse in- 
duzierbaren Defektes, beispielsweise temperaturinduzierbar , in 
den Zellen vorhanden sein, Es konnen im Prinzip auch Organismen 

45 verwendet werden, die keine naturliche Biotinproduktion aufwei- 
sen, nachdem sie mit den Biotingenen transf ormiert wurden. 
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Dm die Biotinproduktivi tat insgesamt weiter zu steigern sollten 
die Organismen im erf indungsgemaBen Verfahren vorteilhaf terweise 
zusatzlich mindesten ein weiteres Biotingen ausgewahlt aus der 
Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
5 Oder bioR enthalten. Vorteilhaf terweise konnen auch solche Gene 
in Kombination mit der Sequenz SEQ ID No, 1 / der SEQ ID NO: 3, 
der SEQ ID No. 5 Oder der SEQ ID NO. 7 und ihrer Kombinationen in 
der Zelle vorhanden sein, die die Biotinsynthese stimulieren . 
Gene die die Biotinsynthese stiromulieren sind z. B. das Flavore- 
10 doxin-Gen, die Flavoredoxin-Reduktase-Gen. Dieses zusatzliche Gen 
Oder diese zusatzlichen Gene konnen wie auch die Gene mit der Se- 
quenz SEQ ID No. 1 , der SEQ ID NO. 3, SEQ ID No. 5 Oder der SEQ ID 
NO. 7 Oder deren Kombinationen in ein oder mehreren Kopien in der 
Zelle vorhanden sein. Sie kdnnen auf dem gleichen Vektor wie die 
Sequenz SEQ ID No. 1, SEQ ID NO. 3, SEQ ID No. 5 und/oder SEQ ID 
No. 7 lokalisiert sein Oder auf getrennten Vektoren Oder aber 
chromosomal integriert worden sein. Auch die Sequenzen SEQ ID 
No. 1, SEQ ID No. 3, SEQ ID No. 5 und/oder SEQ ID No . 7 konnen zu- 
sammen auf einem Vektor oder auf getrennten Vektoren sein Oder 
ins Genom inseriert werden. 

20 

Unter dem erf indungsgemafien Genkonstrukt sind die Gensequenzen 
des SAM-Synthase-Gens SEQ ID No. 1 und der Biotinsynthegene SEQ 
ID No. 3, SEQ ID No. 5 und/oder SEQ ID No. 7, sowie deren funktio- 
25 nelle Varianten, Analoge oder Derivate zu verstehen, die mit ei- 
nem Oder mehreren Regulationssignalen zur Erhohung der Genexpres- 
sion funktionell verknupft wurden. Zusatzlich zu diesen neuen Re- 
gulationssequenzen ksmn die naturliche Regulation dieser Sequen- 
zen vor den eigentlichen Strukturgenen noch vorhanden sein und 
gegebenenf alls genetisch verandert worden sein, so daB die natur- 
liche Regulation ausgeschaltet und die Expression der Gene erhoht 
wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut sein, 
das heiflt es werden keine zusatzlichen Regulationssignale vor die 
Sequenzen SEQ ID No. 1, SEQ ID No. 3, SEQ ID No. 5 und/oder SEQ ID 
No. 7 inseriert und der naturliche Promoter mit seiner Regulation 
wird nicht entfernt. Stattdessen wird die naturliche Regulations - 
sequenz so mutiert, daB keine Regulation durch Biotin mehr er- 
folgt und die Genexpression gesteigert wird. Die Sequenzen SEQ ID 
No. 1, SEQ ID No. 3, SEQ ID No . 5 und/oder SEQ ID No. 7 konnen unter 
der Regulation eines Promoters oder unter der Regulation getrenn- 
^0 ter Promotoren liegen. Auch am 3'-Ende der DNA-Sequenzen konnen 
zusatzliche vorteilhafte regulatorische Elemente inseriert wer- 
den. Die Gene mit den Sequenzen SEQ ID No. 1, SEQ ID No. 3, SEQ 
ID No. 5 Oder SEQ ID No. 7 konnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 

45 

Vorteilhafte Regulationssequenzen fur das erf indungsgemafle Ver- 
fahren sind beispielsweise in Promotoren wie cos-, tac-, trp-. 
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tet-, trp-tet-, Ipp-. lac-, Ipp-lac-, lad*?"' T7-, T3-, 
gal-, trc-, ara-, SP6-, X-Pr- oder im X-PL-Promotor enthalten, die 
vorteilhaf teirweise in gram-negativen Bakterien Anwendung finden. 
Weitere vorteilhaf te Regulationssequenzen sind beispielsweise in 
5 den gram-posit iven Promotoren amy und SP02 , in den Hef epromotoren 
ADCl, MFa , AC, P-60, CYCl, GAPDH Oder in den Pf lanzenpromotoren 
CaMV/35S, SSU, OCS, lib4, usp, STLSl, B33, nos Oder im Ubiquitin- 
oder Phaseolin-Promotor enthalten. 

10 Prinzipiell konnen alle naturlichen Promotoren mit ihren Regula- 
tionssequenzen wie die oben genannten fur das erf indungsgemaBe 
Verfahren verwendet werden. Daruberhinaus konnen auch syntheti- 
sche Promotoren vorteilhaf t verwendet werden* 

_ 15 Im Genkonstrukt konnen weitere Biotingene ausgewahlt aus der 
^^^^k Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, bioY 
^I^^^P Oder bioR in einer oder mehreren Kopien enthalten sein, die einen 

^^^^^ eigenen Promotor haben konnen oder aber unter der Regulation des 
Promotors einer der Sequenzen oder unter der Regulation des Pro- 
20 motors der gesamten Sequenzen SEQ ID No. 1, SEQ ID No- 3, SEQ ID 
No. 5 Oder SEQ ID No. 7 liegen konnen. 

Das Genkonstrukt wird zur Expression in den oben genannten Wirts- 
organismus vorteilhaf terweise in einen wirtsspezif ischen Vektor 
25 inseriert, der eine optimale Expression der Gene im Wirt ermog- 
licht. Vektoren sind dem Fachmann wohl bekannt und konnen bei- 
spielsweise aus dem Buch Cloning Vectors (Eds. Pouwels P. H. et 
al. Elsevier, Amsterdam-New York-Oxford, 1985, ISBN 0 444 904018) 
entnommen werden. Unter Vektoren sind auBer Plasmiden auch alle 
30 anderen dem Fachmann bekannten Vektoren wie beispielsweise Pha- 
^^^^ gen, Viren, Transposons, IS-Elemente, Phasmide, Cosmide, lineare 
^^^^A Oder zirkulare DNA zu verstehen, Diese Vektoren konnen autonom im 
^^^^ Wirtsorganismus repliziert oder chromosomal repliziert werden. 

35 Unter Expressionssysteme sind die Kombination aus den oben bei- 
spielhaf t genannten Wirtsorganismen und den zu den Organismen 
passenden Vektoren wie Plasmide, Viren oder Phagen wie beispiels- 
weise Plasmide mit dem RNA-Polymerase/Promoter System, die Phagen 
X, Mu Oder andere temperante Phagen oder Transposons und/oder wei 

40 teren vorteilhaf ten regulatorischen Sequenzen zu verstehen. 



Bevorzugt sind unter dem Begriff Expressionssysteme die Kombina- 
tion aus Escherichia coli und seinen Plasmiden und Phagen und den 
dazugehorenden Promotoren sowie Bacillus und seine Plasmide und 
Promotoren zu verstehen. 
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Fur die vorteilhafte erf indxmgsgemaBe Expression der SEQ ID No.l, 
SEQ ID No. 3, SEQ ID No . 5 und/oder SEQ ID No. 7 sind aufierdem wei- 
tere 3' und/oder 5' Terminale regulatorische Seguenzen geeignet- 

Diese regulatorischen Sequenzen sollen die gezielte Expression 
der Biotingene und der Proteinexpression ermoglichen. Dies kann 
beispielsweise je nach Wirtsorganismus bedeuten, daB das Gen erst 
nach Induktion exprimiert oder uberexprimiert wird, oder da6 es 
sofort exprimiert und/oder uberexprimiert wird. 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugs- 
weise die Biotingenexpression positiv beeinf lussen und dadurch 
erhohen. So kann eine Verstarkung der regulatorischen Elemente 
vorteilhaf terweise auf der Transkriptionsebene erfolgen, indem 
Starke Transkriptionssignale wie Promotoren und/oder "Enhancer" 
verwendet werden, Daneben ist aber auch eine Verstarkung der 
Translation moglich, indem beispielsweise die Stabilitat der mRNA 
verbessert wird. 

Unter "Enhancer" sind beispielsweise DNA-Sequenzen zu verstehen, 
die uber eine verbesserte Wechselwirkung zwischen RNA-Polymerase 
und DNA eine erhohte Biotingenexpression bewirken. 



25 Eine Steigerung der von der Sequenz SEQ ID No. 1, SEQ ID No. 3, 
SEQ ID No. 5 und SEQ ID No. 7 abgeleiteten Proteinen (siehe SEQ ID 
No. 2, SEQ ID No. 4, SEQ ID No . 6 und SEQ ID No. 8) und ihrer Enzy- 
maktivitat l^fit sich zum Beispiel gegenuber den Ausgangsenzymen 
durch Veranderung der entsprechenden Gensequenzen oder der Se- 
30 quenzen seiner Homologen durch klassische Mutagenese wie UV-Be- 
strahlung oder Behandlung mit chemischen Mutagentien und/oder 
durch gezielte Mutagenese wie site directed mutagenesis, Dele- 
tion(en), Insertion (en) und/oder Substitution (en) erzielen. Auch 
kann eine erhohte Enzymaktivi tat neben der beschriebenen Genam- 
35 plif ikation durch Ausschaltxing von Faktoren, die die Enzymbio- 
synthese reprimieren und/oder durch Synthese aktiver statt inak- 
tiver Enzyme erreicht werden. 



Durch das erf indungsgemaBe Verfahren wird die Umwandlung von DTB 
in Biotin und damit die BiotinproduktivitcLt insgesamt lober die in 
die Organismen uber Vektoren und/oder chromosomal klonierten ein- 
gebrachten Biotingene mit der Sequenz SEQ ID No. 1, der SEQ ID 
No. 3, SEQ ID No. 5 und der SEQ ID No. 7 und der Kombinationen der 
Gene der Sequenz SEQ ID No.l und der SEQ ID No. 5 oder SEQ ID No.l 
45 und der SEQ ID No. 7, bevorzug terweise die Kombination der Gene 
der Sequenz SEQ ID No.l und der SEQ ID No. 3 vorteilhaf t gestei- 
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gert . 





Im erf indungsgemafien Verfahren werden die SEQ ID No.l, SEQ ID 
No. 3, SEQ ID No. 5 und/oder SEQ ID No. 7 enthaltenen Mikroorganis- 
5 men in einem Medium, das das Wachstum dieser Organismen ermog- 
licht, angezuchtet. Dieses Medium kann ein synthetisches Oder ein 
naturliches Medium sein. Je nach Organismus werden dem Fachmann 
bekannte Medien verwendet. Fur das wachstum der Mikroorganismen 
enthalten die verwendeten Medien eine Kohlenstoff quelle, eine 
10 Sticks toff quelle, anorganische Salze und gegebenenf alls geringe 
Mengen an Vitamine und Spurenelemente . 

Vorteilhaf te Kohlenstoff quel len sind beispielsweise Zucker wie 
Mono-, Di- Oder Polysaccharide wie Glucose, Fructose, Mannose, 
15 Xylose, Galactose, Ribose, Sorbose, Ribulose, Lactose, Maltose, 
Saccharose, Raffinose, Starke Oder Cellulose, komplexe Zucker- 
quellen wie Melasse, Zuckerphosphate wie Fructose-1 , 6-bisphosp- 
hat, Zuckeralkohole wie Mannit, Polyole wie Glycerin, Alkohole 
wie Methanol oder Ethanol, Carbonsauren wie Citronensaure, Milch - 
20 saure oder Essigsaure, Fette wie Sojaol oder Rapsol, Aminosauren 
wie Glutaminsaure oder Asparaginsaure oder Aminozucker, die auch 
gleichzeitig als Stickstoff quelle verwendet werden konnen. 

Vorteilhaf te Stickstoff quellen sind organische oder anorganische 
25 stickstoff verbindungen oder Materialien, die diese Verbindungen 
enthalten. Beispiele sind Ammoniumsalze wie NH4CI oder (NH4)2S04, 
Nitrate, Harnstoff , oder komplexe Stickstoff quellen wie Maisquell- 
wasser, Bierhef eautolysat , Soj abohnenmehl, Weizengluten, Hefeex- 
trakt, Fleischextrakt, Caseinhydrolysat , Hefe oder Kartof f elpro- 
30 tein, die haufig auch gleichzeitig als Stickstoff quelle dienen 
konnen . 

Beispiele fur anorganische Salze sind die Salze von Calcium, Ma- 
gnesium, Natrium, Mangan, Kalium, Zink, Kupfer und Eisen. Als An- 
35 ion dieser Salze sind besonders dais Chlor-, Sulfat- und Phospha- 
tion zu nennen. Ein wichtiger Faktor zur Steigerung der Produkti- 
vitat im erf indungsgemafien Verfahren ist der Zusatz von Fe2+- oder 
Fe^'^'-Salzen und/oder Kaliumsalzen z\xm Produktionsmedium. 



*0 Gegebenenf alls werden dem Nahrmedium weitere Wachstumsf aktoren 
2u^"eset^tT^wie-bei"spi'®"ls^ 

Riboflavin, Thiamin, Folsaure, NicotinsSure, Pantothenat oder Py- 
ridoxin, Aminosauren wie Alanin, Cystein, Asparagin, Asparagin- 
saure, Glutamin, Serin, Methonin oder Lysin, Carbonsauren wie Ci- 
45 tronensaure, Ameisensaure, Pimelinsaure oder Milchsaure, oder 
Substanzen wie Dithiothrei tol . 



BASF Aktiengesellscliaf t 980118 



O.Z. 0050/48792/DE 





12 

Zur Stabilisierung der Vektoren mit den Biotingenen in den Zellen 
konnen gegebenenf alls Antibiotika dem Medium zugesetzt werden. 

Das Mischungsverhaltnis der genannten Nahrstoffe hangt von der 
5 Art der Fermentation ab und wird im Einzelfall festgelegt. Die 
Mediumkomponenten konnen alle zu Beginn der Fermentation vorge- 
legt werden, nachdem sie falls erforderlich getrennt sterilisiert 
Oder gemeinsam sterilisiert wurden, oder aber je nach Bedarf wah- 
rend der Fermentation nachgegeben werden. 

10 

Die Zuchtungsbedingungen werden so festgelegt, daB die Organismen 
optimal wachsen und daB die bestmoglichen Ausbeuten erreicht wer- 
den. Bevorzugte Zuchtungstemperaturen liegen bei 15 °C bis 40 *=*C. 
Besonders vorteilhaft sind Temperaturen zwischen 25 und 37 ®C. 
15 vorzugsweise wird der pH-Wert in einem Bereich von 3 bis 9 fest- 
gehalten. Besonders vorteilhaft sind pH-Werte zwischen 5 und 8. 
Im allgemeinen ist eine Inkubationsdauer von 8 bis 240 Stunden 
bevorzugt von 8 bis 12 0 Stunden ausreichend, Innerhalb diser Zeit 
reichert sich die maximale Menge an Biotin im Medium an und/oder 
20 ist nach AufschluB der Zellen verfugbar. 

Das erf indungsgemafie Verfahren zur Herstellung von Biotin kann 
kontinuierlich Oder batch- oder f ed-batch-weise durchgefuhrt wer- 
den. Werden aus den mit den Biotingenen transf ormierten Pflanzen- 
25 zellen ganze Pflanzen regeneriert, so k6nnen diese nach dem er- 
f indungsgemaBen Verfahren ganz normal angezuchtet und vermehrt 
werden . 

Beispiele: 

30 

1. Klonierung des S-Adenosyl-Methionin-Synthase-Gens 
(SEQ ID NO.I) : 

35 Das Gen, das fur SAM-Synthase (metK) kodiert, wurde aus dem Chro- 
mosom von E. coli durch eine Polymerase-Kettenreaktion mit Hilfe 
zweier spezifischer Oligonukleotide ausgehend von genomischer E. 
coli DNA amplif iziert . Die derart amplif izierte DNA wurde aufge- 
reinigt, mit dem Restriktionsenzym Acc65I verdaut und in einen 
mit dem gleichen Enzym geschnittenen Vektor inseriert, der eine 
Uberexpression des Gens in E. coli Stammen erm6glicht. Durch ei- 
nes der beiden Oligonukleotide wurde das Genkonstrukt mit oti- 
mierten Translationssignalen versehen 

45 a.) Entwicklung von Oligonukleotiden zur Amplif izierung des metK 
Gens aus dem E. coli Chromosom: 
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metK soli als Expressionskasset te bestehend aus einer ribosomalen 
Bindixngs telle, dem Startkodon der kodierenden Sequenz und dem 
Stopkodon zwischen zwei Erkennungstellen fur Restriktionsenzyme 
amplifiziert werden. Fur beide Restriktionsschni ttstellen wurde 
5 die Erkennungs sequenz von Acc6 5I gewahlt. Das metK Gen wurde mit 
Hilfe der Oligonucleotide PmetKl (5'- GCGGTACCAGGTGATATTAAATATG - 
GCAAAAC-3') undPmetK2 (5 ' -CGGGTACCGATTACTTCAGACCGGCAGC-3 ' ) am- 
plifiziert und kloniert. 

10 Durchfuhrung der PGR: 

Bedingungen : 

Als Matrize wurden 0,5 \ig chromosomale DNA von E, coll W3110 ver- 
15 wendet. Die Oligonukleotide PmetKl und PmetK2 wurden in einer 
Konzentration von je 15 pMol eingesetzt- Die Konzentration an 
dNTP's betrug 2 00 jjM. Als Polymerase wurden 2,5 U Pwo DNA- Polyme- 
rase (Boehringer Mannheim) im Reaktionspuf f er des Herstellers 
eingesetzt. Das Volixmen der PCR-Reaktion betrug 100 jil. 



Ampl if ika t ionsbedingungen : 

Die Denaturierung der DNA erfolgte fur 2 min bei 94 ^C. Anschlie- 
fiend wurden die Oligonukleotide fur 30 sec bei 55 °C angelagert- 
Die Elongation erfolgte fur 75 sec bei 72 ''C, Die PCR-Reaktion 
wurde uber 30 Zyklen durchgef uhrt . 

Das erhaltene DNA-Produkt mit einer GroSe von ca. 1145 bp wurde 
aufgereinigt und durch Acc65I im geeigneten Puffer verdaut. 

c.) Klonierung von metK in Expressionsvektor 

2 fig des Vektors pHSl (Konstruktion wurde in DE 197.31274.8, 
Prioritat 22.7.97, Beispiele 1. Seite 14 bis 17 beschrieben) wur- 
den duch ACC65I verdaut und durch Shrimp Alkalische Phosphatase 
(SAP) (Boehringer Mannheim) dephosphoryliert . Nach Denaturierung 
der SAP wurden Vektor und Fragment in einem molar en Verhaltnis 
von 1:3 durch den Rapid-DNA-Ligation Kit nach der Vorschrift des 
Hers tellers ligiert. Die Transformation des Ligationsansatzes er- 
_f ojgte_J,rLj[en_^tamm coli XL- 1 -blue. Positive Klone wurden durch 
Plasmldpraparation und Restriktionsanal^se^Td"ehti"f Tz~i~^ 
richtige Orient ierung des MetK-Fragments in pHSl wurde durch Re- 
striktionsverdau und Sequenzierung bestimmt. Das erhaltene Kon- 
strukt wurde pHSl metK (Figur 1) genannt. Die Sequenz von pHSl 
metK ist SEQ ID No. 9 zu entnehmen. SEQ ID No. 10 zeigt die abge- 
leitete Aminosduresequenz der codierenden Region fur metK, 



20 
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2. Konstruktion der Plasmide pHBbiol4 und pHSl bioSl 

Die Konstruktion der Plasmide pHBbiol4 und pHSl bioSl wurde be- 
reits beschrieben (DE 197.31274.8, Prioritat 22.7.97, Beispiele 
5 1,2 und 5 ) . 

3. Konstruktion von pHSl metK bioSl 

Die Plasmide pHSl bioSl [SEQ ID No. 11, (DE 197,31274.8, Prioritat 
10 22.7.97), SEQ ID No. 12 zeigt die abgeleitete Aminosauresequenz 
der codierenden Region fur bioSl] und pHSl metK SEQ ID No. 9 wur- 
den durch einen Plasmid-Praparationsmethode (Boehringer) aufge- 
reinigt. Aus pHSl metK wurde das metK-Gen tragende Fragment durch 
einen Acc65I-Verdau isoliert. pHSl bioSl wurde durch Acc65I ver- 
_ 15 daut, und durch Shrimp Alkalische Phosphatase (SAP) (Boehringer 
^^^^k Mannheim) dephosphoryliert . Nach Denaturierung der SAP nach Vor- 
fl^^^P schrif t des Herstellers wurden Vektor und das metK Fragment in 
^^^^^ einem molaren Verhaltnis von 1:3 durch den Rapid-DNA-Ligation Kit 
nach der Vorschrift des Herstellers ligiert. Die Transformation 
20 des Ligationsansatzes erfogte in den Stamm E. coli XL-l-blue. Po- 
sitive Klone wurden durch Plasmidpraparation und Restriktionsana- 
lyse identif iziert • Die richtige Orientierung des metK-Fragments 
in pHSl bioSl wurde durch Res triktionsverdau und Sequenzierung 
bestimmt. Das erhaltene Konstrukt wurde pHSl metK bioSl (Figur 2) 
25 genannt. Die Sequenz von pHSl metK bioSl ist SEQ ID No. 13 zu ent- 
nehmen. SEQ ID No. 14 zeigt die abgeleitete Aminosauresequenz der 
codierenden Region fur metK, SEQ ID No. 15 zeigt die abgeleitete 
Aminosauresec[uenz der codierenden Region fur bioSl 

30 4. Erhohung der Biotin-Produktivitat durch Uberexpression von 
^^^^ metK, bioSl und metK in Kombination mit bioSl. 

^^^^^ Vom Stamm BM4086 (Ketner und Campbell J. Molec. Biology 1975 

96:13) wurde durch Plattieren auf Rif arapycin-Platten spontan-Ri- 

35 f ampycin-resistente Kolonien isoliert. Von einem dieser resisten- 
ten Stamme wurde ein Pl-Lysat erzeugt. Mit diesem Pl-Lysat wurde 
der Stamm W3110 transduziert und anschlieBend Klone durch Rifam- 
pycin selektioniert . Der erhaltene Stamm mit dem Plasmid pHBbiol4 
nach der CaCl2-Methode transf ormiert (Maniatis et al. Molecular 

40 Cloning Cols Spring Harbour Laboratory Press 1989) und auf LB-Am- 
pizillin 100 ^g/ml angezogen. Der isolierte trnsf ormierte Stamm 
{LU5560) , wurde jeweils mit dem Plasmiden pHSl, pHSl metK, 
pHSl bioSl Oder pHSl metK bioSl nach der CaCl2-Methode transf ormiert 
und auf LB-Agar mit Ampizillin 100 |ig/ml und Kanamyzin 2 5 |ag/ml 

45 selektioniert. 
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Je eine Kolonie der jeweiligen Transf ormanden wurde in einer DYT- 
Kultur mit dem entsprechendem Antibiotika angeimpft und fur 12 h 
inkubiert. Die Ubernachtkul tur (= UNK) wurde eingesetzt um eine 
10 ml Kultur in TB-Medium (Sambrook, J. Fritsch, E F. Maniatis, T. 
5 2nd ed. Cold Spring Harbor Laboratory Press., 1989 

ISBN 0-87969-373-8), das 30g/l Glycerol enthalt, mit den entspre- 
chenden Antibiotika anzuimpfen. Im Fall der Gegenwart der Plas- 
mide pHSl, pHSl metK, pHSlbioSl und pHSl metK bioSl erfolgte gleich- 
zeitig der Zusatz von ImM IPTG und 0,5% Arabinose zur Induktion 
der Genexpression von metK und bioSl bzw. der Kombination beider 
Gene. Nach 24h Stunden wurden die Zellen vom Kulturuber stand 
durch Zentrif ugation abgetrennt und die Biotin-Konzentration 
durch einen kompetitiven ELISA mit Streptavidin im Oberstand be- 
stimmt. Die Ergebnisse dieser Bestimmung sind Tabelle I zu ent- 
nehmen. 

^^^^^^ Tabelle I: Bestimmung der Biotinkonzentration 



20 



Stamm 


Plasmid I 


Plasmid II 


Biotin mg/1 


LU5580 


pHBbiol4 


Kontrolle, ohne 
Plasmid 


11 


LU5580 


pHBbiol4 


pHSl 


25 


LU5580 


pHBbiol4 


pHSl bioSl 


45 


LU5580 


pHBbiol4 


pHSl metK 


37 


LU5580 


pHBbiol4 


pHSl metK bioSl 


52 




40 



45 
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SEQUENZPROTOKOLL 

(1) AliGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) STRASSE: Karl Bosch Strasse 

(C) ORT: Ludwigshafen 

(D) BUNDESLAND: Rheinland-Pf alz 

(E) LAND: Deutschland 

(F) POSTLEITZAHL : 67056 

(ii) ANMELDETITEL: Verfahren zur Herstellung von Biotin 
(iii) ANZAHL DER SEQUENZEN: 15 

(iv) COMPUTER-LESBARE FORM: 
^^^^^k (A) DATENTRAGER: Floppy disk 

^f^^^m (B) COMPUTER: IBM PC compatible 

^^^^^ (C) BETRIEBS SYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentin Release #1.0/ Version #1-25 (EPA) 

(2) INFORMATION ZU SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1155 Basenpaare 

(B) ART: Nxikleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 




(iii) ANTISENSE: NEIN 
(vi) URSPRUNLICHE HERKUNFT: 



(B) STAMM: Escherichia coli 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: metK 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1. . 1155 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 

ATG GCA AAA CAC CTT TTT ACG TCC GAG TCC GTC TCT GAA GGG CAT CCT 
Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 
15 10 15 
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GAC AAA, ATT GCT GAC CAA ATT TCT GAT GCC GTT TTA GAG GCG ATC CTC 
Asp Lys lie Ala Asp Gin lie Ser Asp Ala Val Leu Asp Ala lie Leu 
20 25 30 

GAA GAG GAT CCG AAA GCA CGC GTT GCT TGC GAA ACC TAG GTA AAA ACC 
Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

GGC ATG GTT TTA GTT GGC GGC GAA ATC ACC ACC AGC GCC TGG GTA GAC 
Gly Met Val Leu Val Gly Gly Glu lie Thr Thr Ser Ala Trp Val Asp 
50 55 60 

ATC GAA ..GAG ATC ACC CGT AAC ACC GTT CGC GAA ATT GGC TAT GTG CAT 
lie Glu Glu lie Thr Arg Asn Thr Val Arg Glu lie Gly Tyr Val His 
65 70 75 80 



CC GAC ATG GGC TTT GAC GCT AAC TCC TGT GCG GTT CTG AGC GCT ATC 
r Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala lie 
85 90 95 




GGC AAA CAG TCT CCT GAC ATC AAC CAG GGC GTT GAC CGT GCC GAT CCG 
Gly Lys Gin Ser Pro Asp lie Asn Gin Gly Val Asp Arg Ala Asp Pro 
100 105 110 

CTG GAA CAG GGC GCG GGT GAC CAG GGT CTG ATG TTT GGC TAG GCA ACT 
Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

AAT GAA ACC GAC GTG CTG ATG CCA GCA CCT ATC ACC TAT GCA CAC CGT 
Asn Glu Thr Asp Val Leu Met Pro Ala Pro lie Thr Tyr Ala His Arg 
130 135 140 

CTG GTA CAG CGT CAG GCT GAA GTG CGT AAA AAC GGC ACT CTG CCG TGG 
Jlieu Val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
' 45 150 155 160 

^TG- CGC GCG GAC GCG AAA AGC CAG GTG ACT TTT CAG TAT GAC GAC GGC 
Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 

165 170 175 

AAA ATC GTT GGT ATC GAT GCT GTC GTG CTT TCC ACT CAG CAC TCT GAA 
Lys lie Val Gly lie Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

G AG ATC GAC CAG AAA TGG CTG CAA GAA GCG GTA ATG GAA GAG ATC ATC 
Glu He Asp Gin Lys^Ser~I^ir Glh^GliT Al^ 

195 200 205 

AAG CCA ATT CTG CCC GCT GAA TGG CTG ACT TCT GCC ACC AAA TTC TTC 
Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 
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ATC AAG CCG ACC GGT CGT TTC GTT ATC GGT GGC CCA ATG GGT GAC TGC 

lie Asn Pro Thr Gly Arg Phe Val lie Gly Gly Pro Met Gly Asp Cys 

225 230 235 240 

GGT CTG ACT GGT CGT AAA ATT ATC GTT GAT ACC TAC GGC GGC ATG GCG 
Gly Leu Thr Gly Arg Lys lie lie Val Asp Thr Tyr Gly Gly Met Ala 

245 250 255 

CGT CAC GGT GGC GGT GCA TTC TCT GGT AAA GAT CCA TCA AAA GTG GAC 
Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 

CGT TCC GCA GCC TAC GCA GCA CGT TAT GTC GCG AAA AAC ATC GTT GCT 
Arg Ser-Arlna- Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn lie Val Ala 
275 280 285 

GCT GGC CTG GCC GAT CGT TGT GAA ATT CAG GTT TCC TAC GCA ATC GGC 
la Gly Leu Ala Asp Arg Cys Glu lie Gin Val Ser Tyr Ala lie Gly 
290 295 300 

GTG GCT GAA CCG ACC TCC ATC ATG GTA GAA ACT TTC GGT ACT GAG AAA 
Val Ala Glu Pro Thr Ser lie Met Val Glu Thr Phe Gly Thr Glu Lys 
305 310 315 320 

GTG CCT TCT GAA CAA CTG ACC CTG CTG GTA CGT GAG TTC TTC GAC CTG 
Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 

325 330 335 

CGC CCA TAC GGT CTG ATT CAG ATG CTG GAT CTG CTG CAC CCG ATC TAC 
Arg Pro Tyr Gly Leu lie Gin Met Leu Asp Leu Leu His Pro lie Tyr 
340 345 350 

AAA GAA ACC GCA GCA TAC GGT CAC TTT GGT CGT GAA CAT TTC CCG TGG 
Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 

AA AAA ACC GAC AAA GCG CAG CTG CTG CGC GAT GCT GCC GGT CTG AAG 
Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 

TAA 
385 

(2) INFORMATION 2U SEQ ID NO: 2: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 3 84 Aminosauren 

(B) ART: Amino saure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS: Protein 
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(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 2: 

Met Ala Lys His Leu Fhe Thr Ser Glu Ser val Ser Glu Gly His Pro 
15 10 15 

Asp Lys He Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

Gly Met Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 
50 . 55 60 

He Glu Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 
65 70 75 80 



er Asp Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He 

85 90 95 




Gly Lys Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro 
100 105 110 

Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

Asn Glu Thr Asp Val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg 
130 135 140 

Leu Val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
145 150 155 160 

Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 

165 170 175 

ys He Val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

Glu He Asp Gin Lys Ser Leu Gin Glu Ala- Val Met Glu Glu He He 
195 200 205 

Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 

He Asn Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
225 230 235 240 



Gly Leu Thr Gly Arg Lys He He Val Asp Thr Tyr Gly "Gly Met-Aia- 

245 250 255 

Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 



BASF Aktiengesellschaf t 980118 O.Z. 0050/48792/DE 



20 

Arg Ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn lie Val Ala 
275 280 285 





Ala Gly Leu Ala Asp Arg Cys Glu lie Gin Val Ser Tyr Ala lie Gly 
290 295 300 

Val Ala Glu Pro Thr Ser lie Met Val Glu Thr Phe Gly Thr Glu Lys 
305 310 315 320 

Val Pro Ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 

325 330 335 

Arg Pro Tyr Gly Leu lie Gin Met Leu Asp Leu Leu His Pro lie Tyr 
_^ 340 345 350 

Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 

lu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 

(2) INFORMATION ZU SEQ ID NO: 3: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1206 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genomisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTISENSE: NEIN 

(vi) URSPRUNLICHE HERKUNFT : 

(B) STAMM: Escherichia coli 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: bioSl 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1..1206 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 3: 

ATG AAC GTT TTT AAT CCC GCG GAG TTT CGC GCC GAG TTT CCC GCA CTA 
Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

GAG GAT GCG GGC GTC TAT CTC GAC AGC GCC GCG ACC GCG CTT AAA CCT 
Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 
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GAA GCC GTG GTT GAA GCC ACC CAA GAG TTT TAG AGT CTG AGO GCC GGA 

Glu Ala yal Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
.3.5 40 45 

AAC GTG CAT CGC AGO GAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 
Asn Val HjLs Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 
Tvr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

GAT AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG 
Asp Lys TKr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

,GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 
' al Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 
He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 
Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 
Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

AGT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 
ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 

<:CG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 
Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

GTG ATG GTT GAT GGT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 
Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 
"ciii" Gln^Leu Aip^ Yri~A^~Ph-e Tyr-Ala-Phe-Ser-Gl-y^^ 
210 215 220 

GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 
Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 
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GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

TTT GAG GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 
Phe ASP Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG 
Thr Pro Asn Val Ala Gly val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA 
Leu Ala ASP Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

OA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA 
la Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
05 310 315 320 

TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT 
Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG 
His His ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA 
Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT 
hr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG 
val ASP Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 



GAT TAA 
Asp 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1206 



(2) INFORMATION ZU SEQ ID NO: 4: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) lAnGE: 401 Aminosauren 

(B) ART: Aminos^ure 
(D) TOPOLOGIE: linear 



(ii) ART DES MOLEKULS : Protein 
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(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 4: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 ^5 

Gin ASP Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 



Glu Ala val val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 



Asn 

50 



55 60 




Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

3 Lvs Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 
85 90 ^5 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He val ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 

130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 



155 160 



ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 



o Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
180 185 190 

val Met val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 



235 240 



Ala Met ser Pro Trp Leu Gly Gly Gly-Lys-Met-Val His-Glu-Val- Ser 

245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
.., 260 265 270 
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Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala ATa Leu Glu Trp 
275. 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

His His &er-Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

hr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

val ASP Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

Asp 



(2) INFORMATION ZU SEQ ID NO: 5: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1215 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 




(ii) ART DES MOLEKULS : DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 



(iii) ANTISENSE: NEIN 

(vi) URSPRUNGLICHE HERKUNFT : 

(B) STAMM: Escherichia coli 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: bioS2 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) liAGE: 1..1215 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 5: 
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ATG AAA TTA CCG ATT TAT CTC GAC TAG TCC GCA ACC ACG CCG GTG GAG 
M.h Lvs Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 

GCG CGT GTT GCG GAG AAA ATG ATG GAG TTT ATG AGG ATG GAG GGA AGC 
Pro Arg Val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 

30 



20 



25 




TTT GGT AAG CGG GGG TGC CGT TGT GAC CGT TTC GGG TGG GAG GGT GAA 
Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 
35 40 45 

GAA GGG GTA GAT ATG GGG GGT AAT GAG ATT GGG GAT GTG GTG GGG GGT 
Glu Ala val Asp He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 60 

GAT GGG CGT GAA ATG GTG TTT AGC TGT GGT GCA AGC GAA TGT GAC AAG 
' sp Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 
65 70 75 80 

GTG GGG ATG AAA GGT GGA GCC AAG TTT TAT GAG AAA AAA GGG AAG GAC 
Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 95 

ATG ATG AGC AGC AAA ACC GAA GAC AAA GCG GTA GTG GAT ACG TGC CGT 
He He Thr Ser Lys Thr Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 




48 



96 



144 



192 



240 



288 



336 



384 



GAG CTG GAG CGG GAA GGT TTT GAA GTG ACC TAG CTG GCA CCG GAG CGT 
Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

AAG GGG ATT ATC GAC GTG AAA GAA GTT GAA GCA GGG ATG GGT GAC GAC 432 
Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 

ACC ATC CTC GTG TGC ATC ATG CAC GTA AAT AAC GAA ATC GGG GTG GTG 
Thr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 155 160 

CAG GAT ATC GGG GGT ATC GGG GAA ATG TGG CGT GGT CGT GGG ATT ATC 
Gin Asp He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 

165 170 175 

TAT CAG GTT GAT GCA ACG CAG AGC GTG GGT AAA CTG CGT ATC GAG CTG 

lY7rtis^Vai~Ai^>'Xli:-Thr-Grn-Ser-Val-Gly-Lys-Leu--P^^^ 

180 185 190 

AGC GAG TTG AAA GTT GAG GTG ATG TGT TTC TCC GGT CAC AAA ATC TAT 624 
ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 
195 200 205 



480 



528 



576 
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GGC CCG AAA GGT ATC GGT GCG CTG TAT GTA CGT CGT AAA CCG CGC GTA 
Gly pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro.Arg Val 
210 215 220 

CGC ATC GAA GCG CAA ATG CAC GGC GGC GGT CAC GAG CGC GGT ATG CGT 
Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 

TCC GGC ACT CTG CCT GTT CAC CAG ATC GTC GGA ATG GGC GAG GCC TAT 
Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 

245 250 255 





672 



720 



768 



816 



CGC ATC GCA AAA GAA GAG ATG GCG ACC GAG . ATG GAA CGT CTG CGC GGC 
Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

CTG CGT AAC CGT CTG TGG AAC GGC ATC AAA GAT ATC GAA GAA GTT TAC 864 
eu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

CTG AAC GGT GAC CTG GAA CAC GGT GCG CCG AAC ATT CTC AAC GTC AGC 912 
Leu Asn Gly Asp Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

TTC AAC TAC GTT GAA GGT GAG TCG CTG ATT ATG GCG CTG AAA GAC CTC 960 
Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 
305 310 315 320 

GCA GTT TCT TCA GGT TCC GCC TGT ACG TCA GCA AGC CTC GAA CCG TCC 1008 
Ala val ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

TAC GTG CTG CGC GCG CTG GGG CTG AAC GAC GAG CTG GCA CAT AGC TCT 1056 
Tyr val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

ATC CGT TTC TCT TTA GGT CGT TTT ACT ACT GAA GAA GAG ATC GAC TAC 1104 
He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

ACC ATC GAG TTA GTT CGT AAA TCC ATC GGT CGT CTG CGT GAC CTT TCT 1152 
Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

CCG CTG TGG GAA ATG TAC AAG CAG GGC GTG GAT CTG AAC AGC ATC GAA 1200 
Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 



TGG GCT CAT CAT TAA 
Trp Ala His His 

405 



1215 



(2) INFORMATION ZU SEQ ID NO: 6: 
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(i) SEQUENZ CHARAKTERISTIKA: 

(A) lAnGE: 404 Aininosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DBS MOLEKOLS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 6: 

Met Lys Leu Pro He Tyr Leu Asp Tyr Ser Ala Thr Thr Pro Val Asp 
1 5 10 ^5 

val Ala Glu Lys Met Met Gin Phe Met Thr Met Asp Gly Thr 



pro Arg 

20 



25 30 



Phe Gly Asn Pro Ala Ser Arg Ser His Arg Phe Gly Trp Gin Ala Glu 




35 



40 45 




lu Ala val ASP He Ala Arg Asn Gin He Ala Asp Leu Val Gly Ala 
50 55 SO 

ASP Pro Arg Glu He Val Phe Thr Ser Gly Ala Thr Glu Ser Asp Asn 

55 70 75 

Leu Ala He Lys Gly Ala Ala Asn Phe Tyr Gin Lys Lys Gly Lys His 

85 90 

He He Thr Ser Lys Thr -Glu His Lys Ala Val Leu Asp Thr Cys Arg 
100 105 110 

Gin Leu Glu Arg Glu Gly Phe Glu Val Thr Tyr Leu Ala Pro Gin Arg 
115 120 125 

Asn Gly He He Asp Leu Lys Glu Leu Glu Ala Ala Met Arg Asp Asp 
130 135 140 



hr He Leu Val Ser He Met His Val Asn Asn Glu He Gly Val Val 
145 150 . 155 

Gin ASP He Ala Ala He Gly Glu Met Cys Arg Ala Arg Gly He He 

165 170 175 

Tyr His Val Asp Ala Thr Gin Ser Val Gly Lys Leu Pro He Asp Leu 
180 185 190 

ser Gin Leu Lys Val Asp Leu Met Ser Phe Ser Gly His Lys He Tyr 

195 ^200 205 

Gly Pro Lys Gly He Gly Ala Leu Tyr Val Arg Arg Lys Pro Arg Val 
210 215 220 

Arg He Glu Ala Gin Met His Gly Gly Gly His Glu Arg Gly Met Arg 
225 230 235 240 
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Ser Gly Thr Leu Pro Val His Gin He Val Gly Met Gly Glu Ala Tyr 

245 250 255 

Arg He Ala Lys Glu Glu Met Ala Thr Glu Met Glu Arg Leu Arg Gly 
260 265 270 

Leu Arg Asn Arg Leu Trp Asn Gly He Lys Asp He Glu Glu Val Tyr 
275 280 285 

Leu Asn Gly ASP Leu Glu His Gly Ala Pro Asn He Leu Asn Val Ser 
290 295 300 

Phe Asn Tyr Val Glu Gly Glu Ser Leu He Met Ala Leu Lys Asp Leu 

ntn 315 320 

305 310 

Ala val ser Ser Gly Ser Ala Cys Thr Ser Ala Ser Leu Glu Pro Ser 

325 330 335 

■yr Val Leu Arg Ala Leu Gly Leu Asn Asp Glu Leu Ala His Ser Ser 
340 345 350 

He Arg Phe Ser Leu Gly Arg Phe Thr Thr Glu Glu Glu He Asp Tyr 
355 360 365 

Thr He Glu Leu Val Arg Lys Ser He Gly Arg Leu Arg Asp Leu Ser 
370 375 380 

Pro Leu Trp Glu Met Tyr Lys Gin Gly Val Asp Leu Asn Ser He Glu 
385 390 395 400 

Trp Ala His His 



(2) INFORMATION ZU SEQ ID NO: 7: 

SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 1221 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: DNS (genoitiisch) 

(iii) HYPOTHETISCH: NEIN 

(iii) ANTISENSE: NEIN 

(vi) URSPRUNIilCHE HERKUNFT: 

(B) STAMM: Escherichia coli 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: bioS3 
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(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 1..1221 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 7: 

ATG ATT TTT TCC GTC GAG AAA GTG CGG GCC GAG TTT CCG GTG CTT TCG 48 
Met lie Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser 
1 5 10 15 

CGT GAG GTA AAC GGT TTG CCG CTG GCT TAT CTC GAC AGC GCC GCC AGT 96 
Arg Glu Val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser 
20 25 30 

GCG CAG AAA CCG AGC CAG GTG ATT GAC GCC GAG GCC GAG TTT TAT CGT 144 
Ala Gin Lys Pro Ser Gin Val He Asp Ala Glu Ala Glu Phe Tyr Arg 
35 40 45 

^AT GGC TAC GCG GCG GTG CAT CGT GGT ATT CAT ACC TTA AGC GCC CAG 192 
His Gly Tyr Ala Ala Val His Arg Gly He His Thr Leu Ser Ala Gin 
50 55 60 

GCG ACC GAG AAA ATG GAG AAC GTG CGC AAG CGG GCA TCG CTG TTT ATT 240 
Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe He 
65 70 75 80 

AAT GCC CGT TCG GCG GAA GAG CTG GTG TTC GTC CGC GGC ACG ACG GAA 288 
Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu 

85 90 95 

GGG ATC AAT CTG GTC GCC AAT AGC TGG GGC AAC AGC AAC GTG CGG GCG 336 
Gly He Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala 
100 105 110 

IGC GAT AAC ATC ATC ATC AGT CAG ATG GAG CAC CAC GCT AAC ATT GTT 384 
ly Asp Asn He He He Ser Gin Met Glu His His Ala Asn He Val 
115 120 125 

CCC TGG CAG ATG CTT TGC GCA CGC GTT GGC GCA GAG CTG CGT GTG ATC 432 
Pro Trp Gin Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val He 
130 135 140 

CCG CTC AAT CCC GAT GGT ACG TTG CAA CTG GAG ACG CTG CCT ACG CTG 480 
Pro Leu Asn Pro Asp Gly Thr Leu Gin Leu Glu Thr Leu Pro Thr Leu 
145 150 155 160 



TTT GAT GAG AAA ACT CGC CTG CTG GCA ATT ACT CAT GTC TCC AAC GTG 
Phe Asp Glu Lys Thr Arg Leu Leu Ala He Thr His Val Ser Asn Val 

165 170 175 

CTT GGC ACA GAA AAT CCA CTG GCG GAA ATG ATC ACG CTT GCG CAC CAG 
Leu Gly Thr Glu Asn Pro Leu Ala Glu Met He Thr Leu Ala His Gin 
180 185 190 



"528 



576 
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CAT GGC GCA AAA GTG CTG GTG GAT GGC GCT CAG GCG GTG ATG CAT CAT 
His Gly Ala Lys Val Leu Val Asp Gly Ala Gin Ala Val Met His His 
195 • 200 205 

CCG GTG GAT GTT CAG GCG CTG GAT TGC GAC TTT TAC GTG TTC TCC GGG 
Pro Val Asp Val Gin Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly 
210 215 220 

CAT AAA CTG TAT GGC CCC ACC GGA ATT GGC ATT CTT TAT GTG AAA GAA 
His Lys Leu Tyr Gly Pro Thr Gly He Gly He Leu Tyr Val Lys Glu 
225 230 235 240 

GCC TTG TTG- CAG GAG ATG CCG CCG TGG GAA GGG GGC GGT TCT ATG ATC 
Ala Leu Leu Gin Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met He 

245 250 255 

;CC ACC GTC AGC CTG AGT GAA GGC ACT ACC TGG ACC AAA GCA CCA TGG 
la Thr val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp 
260 265 270 

CGG TTT GAA GCC GGT ACA CCC AAT ACC GGG GGC ATC ATT GGT CTT GGC 
Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly He He Gly Leu Gly 
275 280 285 

GCG GCG CTG GAG TAT GTT TCG GCG CTG GGG CTT AAT AAC ATA GCC GAG 
Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn He Ala Glu 
290 295 300 

TAT GAA CAG AAT CTG ATG CAT TAT GCG CTA TCA CAG CTG GAA TCT GTA 
Tyr Glu Gin Asn Leu Met His Tyr Ala Leu Ser Gin Leu Glu Ser Val 
305 310 315 320 

CCG GAT CTC ACT CTC TAT GGC CCA CAA AAC AGG CTT GGC GTT ATT GCT 
Pro Asp Leu Thr Leu Tyr Gly Pro Gin Asn Arg Leu Gly Val He Ala 

325 330 335 

TTT AAT CTC GGT AAA CAC CAC GCC TAT GAT GTT GGC AGT TTT CTC GAT 1056 
Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp 
340 345 350 

AAT TAC GGC ATT GCT GTG CGT ACC GGA CAT CAC TGC GCA ATG CCA TTG 1104 
Asn Tyr Gly He Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu 
355 360 365 

ATG GCC TAT TAC AAC GTC CCT GCG ATG TGT CGG GCG TCG CTG GCC ATG 1152 
Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met 
370 375 380 

TAT AAC ACC CAT GAA GAA GTG GAT CGT CTG GTG. ACC GGC CTG CAA CGT 1200 
Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gin Arg 
385 390 395 400 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



i 
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ATT CAC CGT TTG CTG GGA TAA 
lie Kis Arg Leu Leu Gly 

405 

(2) INFORMATION ZU SEQ ID NO: 8: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 406 Aminos ILuren 

(B) ART: Aiainosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 8: 

Met lie Phe Ser Val Asp Lys Val Arg Ala Asp Phe Pro Val Leu Ser 




10 



15 




q Glu val Asn Gly Leu Pro Leu Ala Tyr Leu Asp Ser Ala Ala Ser 
20 25 30 

Ala Gin Lys Pro Ser Gin Val He Asp Ala Glu Ala Glu Phe Tyr Arg 
35 40 45 

His Gly Tyr Ala Ala Val His Arg Gly He His Thr Leu Ser Ala Gin 

50 55 eo 

Ala Thr Glu Lys Met Glu Asn Val Arg Lys Arg Ala Ser Leu Phe He 
65 70 75 80 

Asn Ala Arg Ser Ala Glu Glu Leu Val Phe Val Arg Gly Thr Thr Glu 

85 90 

Gly He Asn Leu Val Ala Asn Ser Trp Gly Asn Ser Asn Val Arg Ala 
100 105 110 

'ly Asp Asn He He He Ser Gin Met Glu His His Ala Asn He Val 
li-5 120 125 

Pro Trp Gin Met Leu Cys Ala Arg Val Gly Ala Glu Leu Arg Val He 
130 135 140 



Pro Leu Asn Pro Asp Gly Thr Leu Gin Leu Glu Thr Leu Pro Thr Leu 
145 150 155 

Phe ASP Glu Lys Thr Arg Leu Leu Ala He Thr His Val Ser Asn Val 

165 1-70 175 



Leu Gly Thr Glu Asn Pro Leu Ala Glu Met He Thr Leu Ala His Gin 
180 185 190 

His Gly Ala Lys Val Leu Val Asp Gly Ala Gin Ala Val Met His His 
195 200 205 
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Pro Val Asp Val Gin Ala Leu Asp Cys Asp Phe Tyr Val Phe Ser Gly 
210 215 220 

His Lys Leu Tyr Gly Pro Thr Gly He Gly He Leu Tyr Val Lys Glu 
225 230 235 240 

Ala Leu Leu Gin Glu Met Pro Pro Trp Glu Gly Gly Gly Ser Met He 

245 250 255 

Ala Thr val Ser Leu Ser Glu Gly Thr Thr Trp Thr Lys Ala Pro Trp 
260 265 270 

Arg Phe Glu Ala Gly Thr Pro Asn Thr Gly Gly He He Gly Leu Gly 
275 280 285 

Ala Ala Leu Glu Tyr Val Ser Ala Leu Gly Leu Asn Asn He Ala Glu 
290 295 300 

Glu Gin Asn Leu Met His Tyr Ala Leu Ser Gin Leu Glu Ser Val 
305 310 315 320 

Pro Asp Leu Thr Leu Tyr Gly Pro Gin Asn Arg Leu Gly Val He Ala 

325 330 335 

Phe Asn Leu Gly Lys His His Ala Tyr Asp Val Gly Ser Phe Leu Asp 
340 345 350 

Asn Tyr Gly He Ala Val Arg Thr Gly His His Cys Ala Met Pro Leu 
355 360 365 

Met Ala Tyr Tyr Asn Val Pro Ala Met Cys Arg Ala Ser Leu Ala Met 
370 375 380 

Tyr Asn Thr His Glu Glu Val Asp Arg Leu Val Thr Gly Leu Gin Arg 
85 390 395 400 

le His Arg Leu Leu Gly 
405 

(2) INFORMATION ZU SEQ ID NO: 9: 

(i) SEQUENZ CHARAKTERISTIKA : 

(A) lAnGE: 3720 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig i 

(ii) ART DES MOLEKuLS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 
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(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHSl metK 

(ix) MERKMALE: 

(A) NAME/SCHLliSSEL: CDS 

(B) LAGE: 530.. 1684 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 9: 
GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 
AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 
GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 
AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240 
^SCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300 
•CAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 
ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420 
AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480 



GGATAACAAT TTCACACACG CTAGCGGTAC CAAAGAGGAG AAATTAACT ATG GCA 

Met Ala 
1 



60 
120 
180 



535 



AAA CAC CTT TTT ACG TCC GAG TCC GTC TCT GAA GGG CAT CCT GAC AAA 583 
Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys 
5 10 15 

ATT GCT GAC CAA ATT TCT GAT GCC GTT TTA GAC GCG ATC CTC GAA CAG 631 
He Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu Glu Gin 
20 25 30 



^..T CCG AAA GCA CGC GTT GCT TGC GAA ACC TAC GTA AAA ACC GGC ATG 679 
Xsp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met 
35 40 45 50 

GTT TTA GTT GGC GGC GAA ATC ACC ACC AGC GCC TGG GTA GAC ATC GAA 727 
Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp He Glu 

55 60 65 

GAG ATC ACC CGT AAC ACC GTT CGC GAA ATT GGC TAT GTG CAT TCC GAC 775 

Glu-He--Thr-Arg-A3n-Thr__VaLArg„Glu^Il^e GjjTjr^ Hi s Ser Asp 

70 75 80 

ATG GGC TTT GAC GCT AAC TCC TGT GCG GTT CTG AGC GCT ATC GGC AAA 823 
Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He Gly Lys 
85 90 95 
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CAG TCT CCT GAC ATC AAC CAG GGC GTT GAC CGT GCC GAT CCG CTG GAA 
Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro Leu Glu 
100 105 110 

CAG GGC GCG GGT GAC CAG GGT CTG ATG TTT GGC TAG GCA ACT AAT GAA 
Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu 
115 120 125 130 

ACC GAC GTG CTG ATG CCA GCA CCT ATC ACC TAT GCA CAC CGT CTG GTA 
Thr Asp val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg Leu Val 

135 140 145 

CAG CGT CAG GCT GAA GTG CGT AAA AAC GGC ACT CTG CCG TGG CTG CGC 
Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg 
150 155 160 

CG GAC GCG AAA AGC CAG GTG ACT TTT CAG TAT GAC GAC GGC AAA ATC 
o Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly Lys He 
165 170 175 

GTT GGT ATC GAT GCT GTC GTG CTT TCC ACT CAG CAC TCT GAA GAG ATC 
Val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu Glu He 
180 185 190 

GAC CAG AAA TCG CTG CAA GAA GCG GTA ATG GAA GAG ATC ATC AAG CCA 
ASP Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu He He Lys Pro 
195 200 205 210 

ATT CTG CCC GCT GAA TGG CTG ACT TCT GCC ACC AAA TTC TTC ATC AAC 
He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe He Asn 

215 220 225 

CCG ACC GGT CGT TTC GTT ATC GGT GGC CCA ATG GGT GAC TGC GGT CTG 
xo Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys Gly Leu 
230 235 240 

ACT GGT CGT AAA ATT ATC GTT GAT ACC TAC GGC GGC ATG GCG CGT CAC 
Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala Arg His 
245 250 255 

GGT GGC GGT GCA TTC TCT GGT AAA GAT CCA TCA AAA GTG GAC CGT TCC 
Gly Gly Gly Ala Phe Ser Gly Lys Asp. Pro Ser Lys Val Asp Arg Ser 
260 265 270 

GCA GCC TAC GCA GCA CGT TAT GTC GCG AAA AAC ATC GTT GCT GCT GGC 
Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala Ala Gly 
275 280 285 290 

CTG GCC GAT CGT TGT GAA ATT CAG GTT. TCC TAC GCA ATC GGC GTG GCT 
Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly Val Ala 

295 300 305 



871 



919 



967 



1015 



1063 



1111 



1159 



1207 



1255 



1303 



1351 



1399 



1447 
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GAA CCG ACC TCC ATC ATG GTA GAA ACT TTC GGT ACT GAG- AAA GTG CCT 1495 

Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro 
310 315 320 

TCT GAA CAA CTG ACC CTG CTG GTA CGT GAG TTC TTC GAC CTG CGC CCA 1543 
ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro 
325 330 335 

TAC GGT CTG ATT CAG ATG CTG GAT CTG CTG CAC CCG ATC TAG AAA GAA 1591 
Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr Lys Glu 
340 345 350 

ACC GCA GCA TAC GGT CAC TTT GGT CGT GAA CAT TTC CCG TGG GAA AAA 1639 
Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys 
355 360 365 370 

,CC GAC AAA GCG CAG CTG CTG CGC GAT GCT GCC GGT CTG AAG TAATCGGTAC 1691 
Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 

375 380 385 



CGCTTGATAT 


CGAATTCCTG 


CAGCCCGGGG 


GATCCCATGG 


TACGCGTGCT 


AGAGGCATCA 


1751 


AATAAAACGA 


AAGGCTCAGT 


CGAAAGACTG 


GGCCTTTCGT 


TTTATCTGTT 


GTTTGTCGGT 


1811 


GAACGCTCTC 


CTGAGTAGGA 


CAAATCCGCC 


GCCCTAGACC 


TAGGGGATAT 


ATTCCGCTTC 


1871 


P TP C^C TC AC T 


GACTCGCTAC 


GCTCGGTCGT 


TCGACTGCGG 


CGAGCGGAAA 


TGGCTTACGA 


1931 


ACGGGGCGGA 


GATTTCCTGG 


AAGATGCCAG 


GAAGATACTT 


AACAGGGAAG 


TGAGAGGGCC 


1991 


GCGGCAAAGC 


CGTTTTTCCA 


TAGGCTCCGC 


CCCCCTGACA 


AGCATCACGA 


AATCTGACGC 


2051 


TCAAATCAGT 


GGTGGCGAAA 


CCCGACAGGA 


CTATAAAGAT 


ACCAGGCGTT 


TCCCCCTGGC 


2111 


^^GCTCCCTCG 


TGCGCTCTCC 


TGTTCCTGCC 


TTTCGGTTTA 


CCGGTGTCAT 


TCCGCTGTTA 


2171 


^^Vggccgcgtt 


TGTCTCATTC 


CACGCCTGAC 


ACTCAGTTCC 


GGGTAGGCAG 


TTCGCTCCAA 


2231 


GCTGGACTGT 


ATGCACGAAC 


CCCCCGTTCA 


GTCCGACCGC 


TGCGCCTTAT 


CCGGTAACTA 


2291 


TCGTCTTGAG 


TCCAACCCGG 


AAAGACATGC 


AAAAGCACCA 


CTGGCAGCAG 


CCACTGGTAA 


2351 


TTGATTTAGA 


GGAGTTAGTC 


TTGAAGTCAT 


GCGCCGGTTA 


AGGCTAAACT 


GAAAGGACAA 


2411 


GTTTTGGTGA 


CTGCGCTCCT 


CCAAGCCAGT 


TACCTCGGTT 


CAAAGAGTTG 


GTAGCTCAGA 


2471 


GAACCTTCGA 


AAAACCGCCC 


TGCAAGGCGG 


TTTTTTCGTT 


TTCAGAGCAA 


GAGATTACGC 


2531 


GCAGACCAAA 


ACGATCTCAA 


GAAGATCATC 


TTATTAATCA 


GATAAAATAT 


TTCTAGATTT 


2591 


CAGTGCAATT 


TATCTCTTCA 


AATGTAGCAC 


CTGAAGTCAG 


CCCCATACGA 


TATAAGTTGT 


2651 


TACTAGTGCT 


TGGATTCTCA 


CCAATAAAAA 


ACGCCCGGCG 


GC AACCGAGC 


GTTCTGAACA 


2711 


AATCCAGATG 


GAGTTCTGAG 


GTCATTACTG 


GATCTATCAA 


CAGGAGTCCA 


AGCGAGCTCT 


2771 
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CGAACCCCAG AGTCCCGCTC AGAAGAACTC GTCAAGAAGG CGATAGAAGG CGATGCGCTG 2831 

CGAATCGGGA GCGGCGATAC CGTAAAGCAC GAGGAAGCGG TCAGCCCATT CGCCGCCAAG 2891 

CTCTTCAGCA ATATCACGGG TAGCCAACGC TATGTCCTGA TAGCGGTCCG CCACACCCAG 2951 

CCGGCCACAG TCGATGAATC CAGAAAAGCG GCCATTTTCC ACCATGATAT TCGGCAAGCA 3011 

GGCATCGCCA TGGGTCACGA CGAGATCCTC GCCGTCGGGC ATGCGCGCCT TGAGCCTGGC 3071 

GAACAGTTCG GCTGGCGCGA GCCCCTGATG CTCTTCGTCG AGATCATCCT GATCGACAAG 3131 

ACCGGCTTCC ATCCGAGTAC GTGCTCGCTC GATGCGATGT TTCGCTTGGT GGTCGAATGG 3191 

GCAGGTAGCC GGATCAAGCG TATGCAGCCG CCGCATTGCA TCAGCCATGA TGGATACTTT 3251 

CTCGGCAGGA GCAAGGTGAG ATGACAGGAG ATCCTGCCCC GGCACTTCGC CCAATAGCAG 3311 

CAGTCCCTT CCCGCTTCAG TGACAACGTC GAGCACAGCT GCGCAAGGAA CGCCCGTCGT 3371 

^CAGCCAC GATAGCCGCG CTGCCTCGTC CTGCAGTTCA TTCAGGGCAC CGGACAGGTC 3431 

GGTCTTGACA AAAAGAACCG GGCGCCCCTG CGCTGACAGC CGGAACACGG CGGCATCAGA 3491 

GCAGCCGATT GTCTGTTGTG CCCAGTCATA GCCGAATAGC CTCTCCACCC AAGCGGCCGG 3551 

AGAACCTGCG TGCAATCCAT CTTGTTCAAT CATGCGAAAC GATCCTCATC CTGTCTCTTG 3611 

ATCAGATCTT GATCCCCTGC GCCATCAGAT CCTTGGCGGC AAGAAAGCCA TCCAGTTTAC 3671 

TTTGCAGGGC TTCCCAACCT TACCAGAGGG CGCCCCAGCT GGCAATTCC 3720 
(2) INFORMATION ZU SEQ ID NO: 10: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) liANGE: 384 Aitiinosauren 

(B) ART: Aminos aure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 10: 

Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 
1 5 10 15 

Asp Lys lie Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

Glu Gin Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 
35 40 45 

Gly Met Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 
50 55 60 
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65 



37 

Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 

75 80 



70 



Ser Asp Met Gly Phe Asp Ala Asn 



Ser Cys Ala Val Leu Ser Ala He 



85 



90 



95 



Gly Lys Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro 

105 110 



100 



Leu 



Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 



115 



120 



125 



Asn Glu Thr Asp Val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg 

135 140 



130 




val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 

155 



150 



teu Arg 



Pro ASP Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 



165 



170 



175 



Lys 



He Val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 



180 



185 



190 



Glu He Asp Gin Lys Ser Leu 

195 200 



Gin Glu Ala Val Met Glu Glu He He 

205 



Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 

215 220 



210 

He Asn 
225 



Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
230 235 240 




Gly Leu Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala 

245 250 255 

His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 



260 



265 



270 



Arg ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala 
275 280 285 

Ala Gly Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly 
290 295 300 

val Ala Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys 

315 320 



305 



310^ 



Val Pro ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu 

330 335 



325 



Asp Leu Leu His Pro He Tyr 



Arg Pro Tyr Gly Leu He Gin Met Leu 

340 345 350 
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Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 

Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 

(2) INFORMATION ZU SEQ ID NO: 11: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 3794 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DES MOLEKOlS: DNS (genomisch) 
(iii) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(vii) UNMITTELBARE HERKUNFT: 
(B) CLON: pHSl bioSl 

(ix) MERKMALE: 

(A) NAME/SCHLtJSSEL: CDS 

(B) LAGE: 601. .1806 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 11: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 60 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 120 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 180 

.GGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 240 

.GCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420 

AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480 

GGATAACAAT TTCACACACG CTAGCGGTAC CGGGCCCCCC CTCGAGGTCG ACGGTATCGA 540 

TAAGCTTGAT ATCGAATTCC TGCAGCCCGG GGGATCCCAT GGTACGCGTC GAGGAGTACC 600 

ATG AAC GTT TTT AAT CCC GCG GAG TTT CGC GCC GAG TTT CCC GCA CTA 648 
Met Asn val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 15 
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CAG GAT GCG GGC GTC TAT CTC GAG AGO GCC GCG ACC GCG CTT AAA CCT 696 
Gin Asp Ala Gly val Tvr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

GAA GCC GTG GTT GAA GCC ACC CAA CAG TTT TAC AGT CTG AGC GCC GGA 744 
Glu Ala val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

AAC GTC CAT CGC AGC CAG TTT GCC GAA GCC CAA CGC CTG ACC GCG CGT 792 
Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

TAT GAA GCT GCA CGA GAG AAA GTG GCG CAA TTA CTG AAT GCA CCG GAT 
Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 



65 70 75 80 

.T AAA ACT ATC GTC TGG ACG CGC GGC ACC ACT GAA TCC ATC AAC ATG 
p Lys Thr lie Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 
85 90 95 



840 



888 



GTG GCA CAA TGC TAT GCG CGT CCG CGT CTG CAA CCG GGC GAT GAG ATT 936 
Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

ATT GTC AGC GTG GCA GAA CAC CAC GCC AAC CTC GTC CCC TGG CTG ATG 984 
He Val ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

GTC GCC CAA CAA ACT GGA GCC AAA GTG GTG AAA TTG CCG CTT AAT GCG 1032 
Val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

CAG CGA CTG CCG GAT GTC GAT TTG TTG CCA GAA CTG ATT ACT CCC CGT 1080 
In Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
5 150 155 160 



..GT CGG ATT CTG GCG TTG GGT CAG ATG TCG AAC GTT ACT GGC GGT TGC 1128 
Ser Arg lie Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

CCG GAT CTG GCG CGA GCG ATT ACC TTT GCT CAT TCA GCC GGG ATG GTG 1176 
Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
ISO 185 190 

_GTG_ ATG_ GTT_GAT G GT GCT CAG GGG GCA GTG CAT TTC CCC GCG GAT GTT 1224 

Val Met Val Asp Gly Ala "Gin m"y^Ala-Val-Hi-s Phe-Pro-A-la- Asp-Val 

195 200 205 

CAG CAA CTG GAT ATT GAT TTC TAT GCT TTT TCA GGT CAC AAA CTG TAT 1272 
Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 
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GGC CCG ACA GGT ATC GGC GTG CTG TAT GGT AAA TCA GAA CTG CTG GAG 1320 
GlY Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

GCG ATG TCG CCC TGG CTG GGC GGC GGC AAA ATG GTT CAC GAA GTG AGT 1368 
Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

TTT GAC GGC TTC ACG ACT CAA TCT GCG CCG TGG AAA CTG GAA GCT GGA 1416 
Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

ACG CCA AAT GTC GCT GGT GTC ATA GGA TTA AGC GCG GCG CTG GAA TGG 1464 
Thr Pro Asn val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

.CTG GCA GAT TAC GAT ATC AAC CAG GCC GAA AGC TGG AGC CGT AGC TTA 1512 
' ,eu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

GCA ACG CTG GCG GAA GAT GCG CTG GCG AAA CGT CCC GGC TTT CGT TCA 1560 
Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

TTC CGC TGC CAG GAT TCC AGC CTG CTG GCC TTT GAT TTT GCT GGC GTT 1608 
Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

CAT CAT AGC GAT ATG GTG ACG CTG CTG GCG GAG TAC GGT ATT GCC CTG 1656 
His His ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

CGG GCC GGG CAG CAT TGC GCT CAG CCG CTA CTG GCA GAA TTA GGC GTA 1704 
Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

ACC GGC ACA CTG CGC GCC TCT TTT GCG CCA TAT AAT ACA AAG AGT GAT 1752 
Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

GTG GAT GCG CTG GTG AAT GCC GTT GAC CGC GCG CTG GAA TTA TTG GTG 1800 
Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 

GAT TAAACGCGTG CTAGAGGCAT CAAATAAAAC GAAAGGCTCA GTCGAAAGAC 1853 
Asp 

TGGGCCTTTC GTTTTATCTG TTGTTTGTCG GTGAACGCTC TCCTGAGTAG GACAAATCCG 1913 

CCGCCCTAGA CCTAGGGGAT ATATTCCGCT TCCTCGCTCA CTGACTCGCT ACGCTCGGTC 1973 

GTTCGACTGC GGCGAGCGGA AATGGCTTAC GAACGGGGCG GAGATTTCCT GGAAGATGCC 2033 
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AGGAAGATAC TTAACAGGGA AGTGAGAGGG CCGCGGCAAA GCCGTTTTTC CATAGGCTCC 
GCCCCCCTGA CAAGCATCAC GAAATCTGAC GCTCAAATCA GTGGTGGCGA AACCCGACAQ 
GACTATAAAG ATACCAGGCG TTTCCCCCTG GCGGCTCCCT CGTGCGCTCT CCTGTTCCTG 
CCTTTCGGTT TACCGGTGTC ATTCCGCTGT TATGGCCGCG TTTGTCTCAT TCCACGCCTG 
ACACTCAGTT CCGGGTAGGC AGTTCGCTCC AAGCTGGACT GTATGCACGA ACCCCCCGTT 
CAGTCCGACC GCTGCGCCTT ATCCGGTAAC TATCGTCTTG AGTCCAACCC GGAAAGACAT 
GCAAAAGCAC CACTGGCAGC AGCCACTGGT AATTGATTTA GAGGAGTTAG TCTTGAAGTC 
ATGCGCCGGT TAAGGCTAAA CTGAAAGGAG AAGTTTTGGT GACTGCGCTC CTCCAAGCCA 
GTTACCTCGG TTCAAAGAGT TGGTAGCTCA GAGAACCTTC GAAAAACCGC CCTGCAAGGC 
GGTTTTTTCG TTTTCAGAGC AAGAGATTAC GCGCAGACCA AAACGATCTC AAGAAGATCA 
TCTTATTAAT CAGATAAAAT ATTTCTAGAT TTCAGTGCAA TTTATCTCTT CAAATGTAGC 
ACCTGAAGTC AGCCCCATAC GATATAAGTT GTTACTAGTG CTTGGATTCT CACCAATAAA 
AAACGCCCGG CGGCAACCGA GCGTTCTGAA CAAATCCAGA TGGAGTTCTG AGGTCATTAC 
TGGATCTATC AACAGQAGTC CAAGCGAGCT CTCGAACCCC AGAGTCCCGC TCAGAAGAAC 
TCGTCAAGAA GGCGATAGAA GGCGATGCGC TGCGAATCGG GAGCGGCGAT ACCGTAAAGC 
ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA AGCTCTTCAG CAATATCACG GGTAGCCAAC 
GCTATGTCCT GATAGCGGTC CGCCACACCC AGCCGGCCAC AGTCGATGAA TCCAGAAAAG 
CGGCCATTTT CCACCATGAT ATTCGGCAAG CAGGCATCGC CATGGGTCAC GACGAGATCC 
TCGCCGTCGG GCATGCGCGC CTTGAGCCTG GCGAACAGTT CGGCTGGCGC GAGCCCCTGA 
'GCTCTTCGT CCAGATCATC CTGATCGACA AGACCGGCTT CCATCCGAGT ACGTGCTCGC 
TCGATGCGAT GTTTCGCTTG GTGGTCGAAT GGGCAGGTAG CCGGATCAAG CGTATGCAGC 
CGCCGCATTG CATCAGCCAT GATGGATACT TTCTCGGCAG GAGCAAGGTG AGATGACAGG 
AGATCCTGCC CCGGCACTTC GCCCAATAGC AGCCAGTCCC TTCCCGCTTC AGTGACAACG 
TCGAGCACAG CTGCGCAAGG AACGCCCGTC GTGGCCAGCC ACGATAGCCG CGCTGCCTCG 
-TCGTGGAGTT-CATT.CAGGGC_ACCGGACAGG^GG^ 

TGCGCTGACA GCCGGAACAC GGCGGCATCA GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA 
TAGCCGAATA GCCTCTCGAC CCAAGCGGCC GGAGAACCTG CGTGCAATCC ATCTTGTTCA 
ATCATGCGAA ACGATCCTCA TCCTGTCTCT TGATCAGATC TTGATCCCCT GCGCCATCAG 
ATCCTTGGCG GCAAGAAAGC CATCCAGTTr ACTTTGCAGG GCTTCCCAAC CTTACCAGAG 



2093 

2153 

2213 

2273 

2333 

2393 

2453 

2513 

2573 

2633 

2693 

2753 

2813 

2873 

2933 

2993 

3053 

3113 

3173 

3233 

3293 

3353 

3413 

3473 

3533 



3593 
3653 
3713 
3773 
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GGCGCCCCAG CTGGCAATTC C 
(2) INFORMATION ZU SEQ ID NO: 12: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 401 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 12: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
15 10 15 

Gin Asp Ala Gly Val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 




20 



25 30 




lu Ala val Val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 
35 40 45 

Asn Val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

Asp Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

Val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

He Val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

al Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

Ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 

165 170 175 

Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala Gly Met Val 
. 180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 

Gin Gin Leu Asp He Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 
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Gly Pro Thr Gly He Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

Phe ASP Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 

Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 

Ala Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
305 310 315 320 

he Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 
325 330 335 

His His ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 



Asp 

^^^^(2) INFORMATION ZU SEQ ID NO: 13: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) lAnGE: 4975 Basenpaare 

(B) ART: Nukleinsaure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: ringformig 

(ii) ART DBS MOLEKULS : DNS (genomisch) 
( iiir^POTHETISCH^NEIN 
(iii) ANTISENSE: NEIN 



(vii) UNMITTELBARE HERKUNFT : 

(B) CLON: pHSl metK bioSl 
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(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE: 1782.. 2987 

(ix) MERKMALE: 

(A) NAME/SCHLUSSEL: CDS 

(B) LAGE: 530.. 1684 

(xi) SEQUENZBESCHREIBUNG : SEQ ID NO: 13: 

GACGTCTGTG TGGAATTGTG AGCGGATAAC AATTTCACAC AGGGCCCTCG GACACCGAGG 

AGAATGTCAA GAGGCGAACA CACAACGTCT TGGAGCGCCA GAGGAGGAAC GAGCTAAAAC 

GGAGCTTTTT TGCCCTGCGT GACCAGATCC CGGAGTTGGA AAACAATGAA AAGGCCCCCA 

AGGTAGTTAT CCTTAAAAAA GCCACAGCAT ACATCCTGTC CGTCCAAGCA GAGGAGCAAA 

GCTCATTTC TGAAGAGGAC TTGTTGCGGA AACGACGAGA ACAGTTGAAA CACAAACTTG 300 

AACAGCTACG GAACTCTTGT GCGTAAGGAA AAGTAAGGAA AACGATTCCT TCTAACAGAA 360 

ATGTCCTGAG CAATCACCTA TGAACTGTCG ACTCGAGATA GCATTTTTAT CCATAAGATT 420 

AGCCGATCCT AAGGTTTACA ATTGTGAGCG CTCACAATTA TGATAGATTC AATTGTGAGC 480 

GGATAACAAT TTCACACACG CTAGCGGTAC CAAAGAGGAG AAATTAACT ATG GCA 535 

Met Ala 



1 




60 
120 
180 
240 



583 



631 



AAA CAC CTT TTT ACG TCC GAG TCC GTC TCT GAA GGG CAT CCT GAC AAA 
Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro Asp Lys 
5 10 15 

ATT GCT GAC CAA ATT TCT GAT GCC GTT TTA GAC GCG ATC CTC GAA CAG 
le Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu Glu Gin 
20 25 30 

GAT CCG AAA GCA CGC GTT GCT TGC GAA ACC TAC GTA AAA ACC GGC ATG 679 
Asp Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr Gly Met 
35 40 45 50 

GTT. TTA GTT GGC GGC GAA ATC ACC ACC AGC GCC TGG GTA GAC ATC GAA 727 
Val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp He Glu 

55 60 65 

GAG ATC ACC CGT AAC ACC GTT CGC GAA ATT GGC TAT GTG CAT TCC GAC 775 
Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His Ser Asp 
70 75 80 

ATG GGC TTT GAC GCT AAC TCC TGT GCG GTT CTG AGC GCT ATC GGC AAA 823 
Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He Gly Lys 
85 90 95 . 
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CAG TCT CCT GAC ATC AAC CAG GGC GTT GAC CGT GCC GAT CCG CTG GAA 
Tn pro Tsp lie A.n Gl. Gly val asp At, Ala Asp Pro Leu Glu 



100 



105 



110 



CAG GGC GCG GGT GAC CAG GGT CTG ATG TTT GGC TAC GCA ACT AAT GAA 
Gin S Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr Asn Glu 
115 120 125 

ACC GAC GTG CTG ATG CCA GCA CCT ATC ACC TAT GCA CAC CGT CTG GTA 
Thr val Leu Met Pro Ala Pro He Thr 'Tyr Ala Hxs Arg Leu Val 

CAG CGT CAG GCT GAA GTG CGT AAA AAC GGC ACT CTG CCG TGG CTG CGC 
Gin Arg . Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp Leu Arg 



150 



155 





CCG GAC GCG AAA AGC CAG GTG ACT TTT CAG TAT GAC GAC GGC AAA ATC 
ro ASP Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly Lys He 
165 170 
GTT GGT ATC GAT GCT GTC GTG CTT TCC ACT CAG CAC TCT GAA GAG ATC 
val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu Glu He 

180 185 190 

GAC CAG AAA TCG CTG CAA GAA GCG GTA ATG GAA GAG ATC ATC AAG CCA 
A^p Gin Lys ser Leu Gin Glu Ala Val Met Glu Glu He He Lys Pro 
195 200 205 

ATT CTG CCC GCT GAA TGG CTG ACT TCT GCC ACC AAA TTC TTC ATC AAC 
iL Leu pro- Ala Glu Trp Leu Thr Ser Al^ Thr Lys Phe Phe He Asn 
215 220 225 

CCG ACC GGT CGT TTC GTT ATC GGT GGC CCA ATG GGT GAC TGC GGT CTG 
pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys Gly Leu 
230 235 240 

ACT GGT CGT- AAA ATT ATC GTT GAT ACC TAC GGC GGC ATG GCG CGT CAC 
Thr Gly Arg Lys He He Val Asp Thr Tyr Gly Gly Met Ala Arg H.s 
245 250 255 

GGT GGC GGT GCA TTC TCT GGT AAA GAT CCA TCA AAA GTG GAC CGT TCC 
^y Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp Arg Ser 

260 265 270 

-GCA-GCC-TAC.-GCA^GCA_CGT_TAT_G^C^CGJ^ AAC ATC GTT GCT GCT GGC 
Ala Ala Tyr Ala Ala Arg Tyr ^^^^^l^Ly^ AWHe-val-Ala-Ala^Gl^^^^ 
275 280 285 

CTG GCC GAT CGT TGT GAA ATT CAG GTT TCC TAC GCA ATC GGC GTG GCT 
Leu Ala ASP Arg Cys Glu He Gin Val Ser Tyr Ala He Gly Val Ala 



871 



919 



967 



1015 



1063 



1111 



1159 



1207 



1255 



1303 



1351 



1399 



1447 



295 



300 
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GAA CCG ACC TCC ATC ATG GTA GAA ACT TTC GGT ACT GAG AAA GTG CCT 
Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys Val Pro 
310 315 320 

TCT GAA CAA CTG ACC CTG CTG GTA CGT GAG TTC TTC GAC CTG CGC CCA 
ser Glu Gin Leu Thr Leu Leu Val Arg Glu Phe Phe Asp Leu Arg Pro 
325 330 335 

TAC GGT CTG ATT CAG ATG CTG GAT CTG CTG CAC CCG ATC TAC AAA GAA 
Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr Lys Glu 
340 345 350 

ACC GCA GCA TAC GGT CAC TTT GGT CGT GAA CAT TTC CCG TGG GAA AAA 
Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp Glu Lys 
355 360 365 370 

ACC GAC AAA GCG CAG CTG CTG CGC GAT GCT GCC GGT CTG AAG TAATCGGTAC 
" hr ASP Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 

375 380 385 

CGGGCCCCCC CTCGAGGTCG ACGGTATCGA TAAGCTTGAT ATCGAATTCC TGCAGCCCGG 

GGGATCCCAT GGTACGCGTC GAGGAGTACC ATG AAC GTT TTT AAT CCC GCG CAG 

Met Asn Val Phe Asn Pro Ala Gin 
1 5 

TTT CGC GCC CAG TTT CCC GCA CTA CAG GAT GCG GGC GTC TAT CTC GAC 
Phe Arg Ala Gin Phe Pro Ala Leu Gin Asp Ala Gly Val Tyr Leu Asp 
10 15 20 

AGC GCC GCG ACC GCG CTT AAA CCT GAA GCC GTG GTT GAA GCC ACC CAA 
ser Ala Ala Thr Ala Leu Lys Pro Glu Ala Val Val Glu Ala Thr Gin 
25 30 35 40 

,CAG TTT TAC AGT CTG AGC GCC GGA AAC GTC CAT CGC AGC CAG TTT GCC 
iln Phe Tyr Ser Leu Ser Ala Gly Asn Val His Arg Ser Gin Phe Ala 

45 50 55 

GAA GCC CAA CGC CTG ACC GCG CGT TAT GAA GCT GCA CGA GAG AAA GTG 
Glu Ala Gin Arg Leu Thr Ala Arg Tyr Glu Ala Ala Arg Glu Lys Val 
60 65 70 

GCG CAA TTA CTG AAT GCA CCG GAT GAT AAA ACT ATC GTC TGG ACG CGC 
Ala Gin Leu Leu Asn Ala Pro Asp Asp Lys Thr He Val Trp Thr Arg 
75 80 85 

GGC ACC ACT GAA TCC ATC AAC ATG GTG GCA CAA TGC TAT GCG CGT CCG 
Gly Thr Thr Glu Ser He Asn Met Val Ala Gin Cys Tyr Ala Arg Pro 
90 95 100 

CGT CTG CAA CCG GGC GAT GAG ATT ATT GTC AGC GTG GCA GAA CAC CAC 
Arg Leu Gin Pro Gly Asp Glu He He Val Ser Val Ala Glu His His 
105 110 115 120 



1495 

1543 

1591 

1639 

1691 

1751 
1805 

1853 

1901 

1949 

1997 

2045 

2093 

2141 
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GCC AAC CTC GTC CCC TGG CTG ATG GTC GCC CAA CAA ACT GGA GCC AAA 
Ala Asn Leu Val Pro Trp Leu Met Val Ala Gin Gin Thr Gly Ala Lys 

125 130 

GTG GTG AAA TTG CCG CTT AAT GCG CAG CGA CTG CCG GAT GTC GAT TTG 
val val Lys Leu Pro Leu Asn Ala Gin Arg Leu Pro Asp Val Asp Leu 
140 145 150 

TTG CCA GAA CTG ATT ACT CCC CGT AGT CGG ATT CTG GCG TTG GGT CAG 
Leu Pro Glu Leu He Thr Pro Arg Ser Arg He Leu Ala Leu Gly Gin 
155 160 165 

ATG TCG AAC GTT ACT GGC GGT TGC CCG GAT CTG GCG CGA GCG ATT ACC 
Met ser Asn Val Thr Gly Gly Cys Pro Asp Leu Ala Arg Ala He Thr 
170 175 180 

TTT GCT CAT TCA GCC GGG ATG GTG GTG ATG GTT GAT GGT GCT CAG GGG 
' 'he Ala His ser Ala Gly Met Val Val Met Val Asp Gly Ala Gin Gly 
85 190 195 200 

GCA GTG CAT TTC CCC GCG GAT GTT CAG CAA CTG GAT ATT GAT TTC TAT 
Ala Val His Phe Pro Ala Asp Val Gin Gin Leu Asp He Asp Phe Tyr 

205 210 215 

GCT TTT TCA GGT CAC AAA CTG TAT GGC CCG ACA GGT ATC GGC GTG CTG 
Ala Phe Ser Gly His Lys Leu Tyr Gly Pro Thr Gly He Gly Val Leu 
220 225 230 

TAT GGT AAA TCA GAA CTG CTG GAG GCG ATG TCG CCC TGG CTG GGC GGC 
Tyr Gly Lys Ser Glu Leu Leu Glu Ala Met Ser Pro Trp Leu Gly Gly 
235 240 245 

GGC AAA ATG GTT CAC GAA GTG AGT TTT GAC GGC TTC ACG ACT CAA TCT 
Gly Lys Met Val His Glu Val Ser Phe Asp Gly Phe Thr Thr Gin Ser 
250 255 260 

Lg CCG TGG AAA CTG GAA GCT GGA ACG CCA AAT GTC GCT GGT GTC ATA 
Ala Pro Trp Lys Leu Glu Ala Gly Thr Pro Asn Val Ala Gly Val He 
265 270 275 280 

GGA TTA AGC GCG GCG CTG GAA TGG CTG GCA GAT TAC GAT ATC AAC CAG 
Gly Leu Ser Ala Ala Leu Glu Trp Leu Ala Asp Tyr Asp He Asn Gin 

285 290 295 



2189 



2237 



2285 



2333 



2381 



2429 



2477 



2525 



2573 



2621 



2669 



2717 



GCC_GAA AGC_TGG AGC CGT AGC TTA GCA ACG CTG GCG GAA GAT GCG CTG 

Ala Glu ser Trp ser^Arg-SefT-eu-Ala Thr-Leu-Ala-Glu- Asp_Ala.Leu 

300 305 310 

GCG AAA CGT CCC GGC TTT CGT TCA TTC CGC TGC CAG GAT TCC AGC CTG 2765 
Ala Lys Arg Pro Gly Phe Arg Ser Phe Arg Cya Gin Asp Ser Ser Leu 
315 320 325 
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CTG GCC TTT GAT TTT GCT GGC GTT CAT CAT AGC GAT A?^GTG ACG CTG 
Leu Ala Phe Asp Phe Ala Gly Val His His Ser Asp Met Val Thr Leu 
330 335 340 

CTG GCG GAG TAC GGT ATT GCC CTG CGG GCC GGG CAG CAT TGC GCT CAG 
Leu Ala Glu Tyr Gly He Ala Leu Arg Ala Gly Gin His Cys Ala Gin 
345 350 355 360 

CCG CTA CTG GCA GAA TTA GGC GTA ACC GGC ACA CTG CGC GCC TCT TTT 
Pro Leu Leu Ala Glu Leu Gly Val Thr Gly Thr Leu Arg Ala Ser Phe 

365 370 375 

GCG CCA TAT AAT ACA AAG AGT GAT GTG GAT GCG CTG GTG AAT GCC GTT 
Ala Pro .Tyr Asn Thr Lys Ser Asp Val Asp Ala Leu Val Asn Ala Val 
380 385 390 

GAC CGC GCG CTG GAA TTA TTG GTG GAT TAAACGCGTG CTAGAGGCAT 
sp Arg Ala Leu Glu Leu Leu Val Asp 
395 400 




2813 



2861 



2909 



2957 



3004 



CAAATAAAAC 


GAAAGGCTCA 


GTCGAAAGAC 


TGGGCCTTTC 


GTTTTATCTG 


TTGTTTGTCG 


3064 


GTGAACGCTC 


TCCTGAGTAG 


GACAAATCCG 


CCGCCCTAGA 


CCTAGGGGAT 


ATATTCCGCT 


3124 


TCCTCGCTCA 


CTGACTCGCT 


ACGCTCGGTC 


GTTCGACTGC 


GGCGAGCGGA 


AATGGCTTAC 


3184 


GAACGGGGCG 


GAGATTTCCT 


GGAAGATGCC 


AGGAAGATAC 


TTAACAGGGA 


AGTGAGAGGG 


3244 


CCGCGGCAAA 


GCCGTTTTTC 


CATAGGCTCC 


GCCCCCCTGA 


CAAGCATCAC 


GAAATCTGAC 


3304 


GCTCAAATCA 


GTGGTGGCGA 


AACCCGACAG 


GACTATAAAG 


ATACCAGGCG 


TTTCCCCCTG 


3364 


GCGGCTCCCT 


CGTGCGCTCT 


CCTGTTCCTG 


CCTTTCGGTT 


TACCGGTGTC 


ATTCCGCTGT 


3424 


TATGGCCGCG 


TTTGTCTCAT 


TCCACGCCTG 


ACACTCAGTT 


CCGGGTAGGC 


AGTTCGCTCC 


3484 


^^GCTGGACT 


GTATGCACGA 


ACCCCCCGTT 


CAGTCCGACC 


GCTGCGCCTT 


ATCCGGTAAC 


3544 


TATCGTCTTG 


AGTCCAACCC 


GGAAAGACAT 


GCAAAAGCAC 


CACTGGCAGC 


AGCCACTGGT 


3604 


AATTGATTTA 


GAGGAGTTAG 


TCTTGAAGTC 


ATGCGCCGGT 


TAAGGCTAAA 


CTGAAAGGAC 


3664 


AAGTTTTGGT 


GACTGCGCTC 


CTCCAAGCCA GTTACCTCGG 


TTCAAAGAGT 


TGGTAGCTCA 


3724 


GAGAACCTTC 


GAAAAACCGC 


CCTGCAAGGC 


GGTTTTTTCG 


TTTTCAGAGC 


AAGAGATTAC 


3784 


GCGCAGACCA 


AAACGATCTC 


AAGAAGATCA 


TCTTATTAAT 


CAGATAAAAT 


ATTTCTAGAT 


3844 


TTCAGTGCAA 


TTTATCTCTT 


CAAATGTAGC 


ACCTGAAGTC 


AGCCCCATAC 


GATATAAGTT 


3904 


GTTACTAGTG 


CTTGGATTCT 


CACCAATAAA AAACGCCCGG 


CGGCAACCGA 


GCGTTCTGAA 


3964 


CAAATCCAGA TGGAGTTCTG 


AGGTCATTAC 


TGGATCTATC 


AACAGGAGTC 


CAAGCGAGCT 


4024 


CTCGAACCCC 


AGAGTCCCGC 


TCAGAAGAAC 


TCGTCAAGAA 


GGCGATAGAA 


GGCGATGCGC 


4084 
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TGCGAATCGG GAGCGGCGAT ACCGTAAAGC ACGAGGAAGC GGTCAGCCCA TTCGCCGCCA 
AGCTCTTCAG CAATATCACG GGTAGCCAAC GCTATGTCCT GATAGCGGTC CGCCACACCC 
AGCCGGCCAC AGTCGATGAA TCCAGAAAAG CGGCCATTTT CCACCATGAT ATTCGGCAAG 
CAGGCATCGC CATGGGTCAC GACGAGATCC TCGCCGTCGG GCATGCGCGC CTTGAGCCTG 
GCGAACAGTT CGGCTGGCGC GAGCCCCTGA TGCTCTTCGT CCAGATCATC CTGATCGACA 
AGACCGGCTT CCATCCGAGT ACGTGCTCGC TCGATGCGAT GTTTCGCTTG GTGGTCGAAT 
GGGCAGGTAG CCGGATCAAG CGTATGCAGC CGCCGCATTG CATCAGCCAT GATGGATACT 
TTCTCGGCAG GAGCAAGGTG AGATGACAGG AGATCCTGCC CCGGCACTTC GCCCAATAGC 
AGCCAGTCCC TTCCCGCTTC AGTGACAACG TCGAGCACAG CTGCGCAAGG AACGCCCGTC 
ITGGCCAGCC ACGATAGCCG CGCTGCCTCG TCCTGCAGTT CATTCAGGGC ACCGGACAGG 

'tcggtcttga caaaaagaac cgggcgcccc tgcgctgaca gccggaacac ggcggcatca 

GAGCAGCCGA TTGTCTGTTG TGCCCAGTCA TAGCCGAATA GCCTCTCCAC CCAAGCGGCC 

ggagaacctg cgtgcaatcc atcttgttca atcatgcgaa acgatcctca tcctgtctct 

TGATCAGATC TTGATCCCCT GCGCCATCAG ATCCTTGGCG GCAAGAAAGC CATCCAGTTT 
ACTTTGCAGG GCTTCCCAAC CTTACCAGAG GGCGCCCCAG CTGGCAATTC C 
(2) INFORMATION ZU SEQ ID NO: 14: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) lAnGE: 384 Aminos aur en 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS : Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 14: 

Met Ala Lys His Leu Phe Thr Ser Glu Ser Val Ser Glu Gly His Pro 
15 10 15 

ASP Lys lie Ala Asp Gin He Ser Asp Ala Val Leu Asp Ala He Leu 
20 25 30 

Glu Gin ASP Pro Lys Ala Arg Val Ala Cys Glu Thr Tyr Val Lys Thr 

35 40 ^-5 



Gly Met val Leu Val Gly Gly Glu He Thr Thr Ser Ala Trp Val Asp 

50 55 60 

He Glu Glu He Thr Arg Asn Thr Val Arg Glu He Gly Tyr Val His 
65 70 75 



4144 

4204 

4264 

4324 

4384 

4444 

4504 

4564 

4624 

4684 

4744 

4804 

4864 

4924 

4975 
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Ser ASP Met Gly Phe Asp Ala Asn Ser Cys Ala Val Leu Ser Ala He 

85 90 ^5 

Gly Lys Gin Ser Pro Asp He Asn Gin Gly Val Asp Arg Ala Asp Pro 
100 105 110 

Leu Glu Gin Gly Ala Gly Asp Gin Gly Leu Met Phe Gly Tyr Ala Thr 
115 120 125 

Asn Glu Thr Asp Val Leu Met Pro Ala Pro He Thr Tyr Ala His Arg 

130 135 140 

Leu val Gin Arg Gin Ala Glu Val Arg Lys Asn Gly Thr Leu Pro Trp 
145 . 150 155 

Leu Arg Pro Asp Ala Lys Ser Gin Val Thr Phe Gin Tyr Asp Asp Gly 

165 170 175 

,ys He val Gly He Asp Ala Val Val Leu Ser Thr Gin His Ser Glu 
180 185 190 

Glu He ASP Gin Lys Ser Leu Gin Glu Ala Val Met Glu Glu He He 
195 200 205 

Lys Pro He Leu Pro Ala Glu Trp Leu Thr Ser Ala Thr Lys Phe Phe 
210 215 220 

He Asn Pro Thr Gly Arg Phe Val He Gly Gly Pro Met Gly Asp Cys 
225 230 235 240 

Gly Leu Thr Gly Arg Lys He He val Asp Thr Tyr Gly Gly Met Ala 

245 250 255 

Arg His Gly Gly Gly Ala Phe Ser Gly Lys Asp Pro Ser Lys Val Asp 
260 265 270 

rg ser Ala Ala Tyr Ala Ala Arg Tyr Val Ala Lys Asn He Val Ala 
275 280 285 

Ala Gly Leu Ala Asp Arg Cys Glu He Gin Val Ser Tyr Ala He Gly 
290 295 300 



val Ala Glu Pro Thr Ser He Met Val Glu Thr Phe Gly Thr Glu Lys 

305 310 315 320 

val Pro ser Glu Gin Leu Thr Leu Leu val Arg Glu Phe Phe Asp Leu 

325 330 335 



Arg Pro Tyr Gly Leu He Gin Met Leu Asp Leu Leu His Pro He Tyr 
340 345 350 

Lys Glu Thr Ala Ala Tyr Gly His Phe Gly Arg Glu His Phe Pro Trp 
355 360 365 
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Glu Lys Thr Asp Lys Ala Gin Leu Leu Arg Asp Ala Ala Gly Leu Lys 
370 375 380 

(2) INFORMATION ZU SEQ ID NO: 15: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LANGE: 401 Aminosauren 

(B) ART: Aminosaure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKULS: Protein 

(xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 15: 

Met Asn Val Phe Asn Pro Ala Gin Phe Arg Ala Gin Phe Pro Ala Leu 
1 5 10 ^5 

m ASP Ala Gly val Tyr Leu Asp Ser Ala Ala Thr Ala Leu Lys Pro 
20 25 30 

val val Glu Ala Thr Gin Gin Phe Tyr Ser Leu Ser Ala Gly 



Glu Ala 

35 



40 45 




Asn val His Arg Ser Gin Phe Ala Glu Ala Gin Arg Leu Thr Ala Arg 
50 55 60 

Tyr Glu Ala Ala Arg Glu Lys Val Ala Gin Leu Leu Asn Ala Pro Asp 
65 70 75 80 

ASP Lys Thr He Val Trp Thr Arg Gly Thr Thr Glu Ser He Asn Met 

85 90 95 

val Ala Gin Cys Tyr Ala Arg Pro Arg Leu Gin Pro Gly Asp Glu He 
100 105 110 

le val Ser Val Ala Glu His His Ala Asn Leu Val Pro Trp Leu Met 
115 120 125 

val Ala Gin Gin Thr Gly Ala Lys Val Val Lys Leu Pro Leu Asn Ala 
130 135 140 

Gin Arg Leu Pro Asp Val Asp Leu Leu Pro Glu Leu He Thr Pro Arg 
145 150 155 160 

ser Arg He Leu Ala Leu Gly Gin Met Ser Asn Val Thr Gly Gly Cys 
165 170 175 



Pro Asp Leu Ala Arg Ala He Thr Phe Ala His Ser Ala-Gly-Met-Val- 
180 185 190 

Val Met Val Asp Gly Ala Gin Gly Ala Val His Phe Pro Ala Asp Val 
195 200 205 
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Gin Gin Leu Asp lie Asp Phe Tyr Ala Phe Ser Gly His Lys Leu Tyr 
210 215 220 

Gly Pro Thr Gly lie Gly Val Leu Tyr Gly Lys Ser Glu Leu Leu Glu 
225 230 235 240 

Ala Met Ser Pro Trp Leu Gly Gly Gly Lys Met Val His Glu Val Ser 

245 250 255 

Phe Asp Gly Phe Thr Thr Gin Ser Ala Pro Trp Lys Leu Glu Ala Gly 
260 265 270 

Thr Pro Asn Val Ala Gly Val He Gly Leu Ser Ala Ala Leu Glu Trp 
275 280 285 



^^^^^ 



Leu Ala Asp Tyr Asp He Asn Gin Ala Glu Ser Trp Ser Arg Ser Leu 
290 295 300 




a Thr Leu Ala Glu Asp Ala Leu Ala Lys Arg Pro Gly Phe Arg Ser 
05 310 315 320 

Phe Arg Cys Gin Asp Ser Ser Leu Leu Ala Phe Asp Phe Ala Gly Val 

325 330 335 

His His Ser Asp Met Val Thr Leu Leu Ala Glu Tyr Gly He Ala Leu 
340 345 350 

Arg Ala Gly Gin His Cys Ala Gin Pro Leu Leu Ala Glu Leu Gly Val 
355 360 365 

Thr Gly Thr Leu Arg Ala Ser Phe Ala Pro Tyr Asn Thr Lys Ser Asp 
370 375 380 

Val Asp Ala Leu Val Asn Ala Val Asp Arg Ala Leu Glu Leu Leu Val 
385 390 395 400 



Figur 1 



Xcml 3633 
Bglll 3615 
Bell 3610 
EagI 3545 
DrdI 3424 
Sal I 3371 
Fspl 3351 
Tthi 1 1 I 3333 



1 Aatll 
42 Apal 
42 iApal 
1 



BssH II 3054 
SphI 3050 

Nael 2951 
RsrII 2935 



iSacI 2765 
Sad 2765 

Spel 2653 



Xbal 2583 
Sspl 2577 
Asel 2564 
Sfu I 2477 
BstBI 2477 




387 Sail 
392 Xho I 
428 AocI 
500 Nhel 
559 Esp3l 
622 EcoNI 
662 SnaBI 
705 PflMI 



881 BstEII 



1070 Clal 



1405 Pvul 



Sac II 1990 



1697 EcoRV 
1703 EcoRI 
1715 Smal 
1715 Xmal 
■1850" Avr II 
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Figur 2 



Bgl II 4870 
Bell 4865 
EagI 4800 
Drd I 4679 
Bal I 4626 
Tthi 1 1 I 4588 



1 Aatll 



SphI 4305 
Nael 4206 
RsrII 4190 
iSacI 4020 
Sad 4020 
Spe I 3908 
Xbal 3838 
Ssp I 3832 
Asel 3819 
Sful 3732 
BstB I 3732 



428 AocI 
500 Nhe! 
559 Esp3l 
622 EcoN I 
662 SnaBI 
705 PflMI 




881 BstE II 



Avrll 3105 



1405 Pvu I 



1 687 Acc65l 

1723 HinDIII 
1735 EcoRI 
1747 Smal 
1747 Xma I 



Bgl I 2832 "T 
Drain 2538 
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Vsrfahren zur Herstellung von Biotin 
Zusammenf assung 

5 

Die Erfindung betrifft ein Genkonstrukt , enthaltend ein S-Adeno- 
syl-Methionin-Synthasegen, mit der Seguenz SEQ ID No. 1 und ein 
Biotin-Biosynthesegen bioSl, bioS2 und/oder bioS3 mit den Sequen- 
zen SEQ ID No. 3, SEQ ID No. 5 bzw. SEQ ID No. 7 und gegebenenf alls 
10 mindestens einer weiteren Biotinsynthesegensequenz ausgewahlt aus 
der Gruppe bioA, bioB, bioF, bioC, bioD, bioH, bioP, bioW, bioX, 
bioY Oder bioR. Die Erfindung betrifft weiterhin Organismen, die 
dieses Genkonstrukt enthalten und die Verwendung des Genkon- 
strukts zur Herstellung von Biotin, sowie ein Verfahren zur Her- 
15 stellung von Biotin. 
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